W tym wpisie przedstawiam 3 sprawdzone metody wykrywania obserwacji odstających w Python. Zapraszam do przeczytania. 🙂
Mateusz Grzyb
3 metody analizy normalności rozkładu w Python
Chciałbym Ci przedstawić 3 skuteczne metody analizy normalności rozkładu w Python. Każda z nich ma inne zalety i możesz używać ich w zależności od potrzeb i kontekstu wykonywanej analizy.
Narzędzia z których korzystam – część 2
Druga i ostatnia część z serii wpisów o narzędziach, których używam w codziennej pracy. Pierwsza dotyczyła software, druga skupia się na hardware. Zapraszam do przeczytania! 🙂
Prezent dla nowych i obecnych subskrybentów bloga
Dla wszystkich nowych i obecnych subskrybentów bloga przygotowałem niespodziankę: darmowe szkolenie w formie screencastu. Jego tematem jest pewna niebanalna technika, która potrafi w sposób znaczący wpłynąć na jakość modelu. 🙂
Narzędzia z których korzystam – część 1
Pytania o narzędzia powtarzają się co jakiś czas w mailach i komentarzach, dlatego dziś dzielę się z Wami zestawem moich zaufanych aplikacji, z których korzystam.
DSP 005: Transformacja zmiennych z użyciem WoE
Transformacja WoE jest bodaj najpopularniejszym reprezentantem metod tzw. target encodingu. W tym odcinku Data Science Plus opowiadam o jej zastosowaniach, wadach i zaletach. Zapraszam do przeczytania i obejrzenia!
Scoring kredytowy z zastosowaniem XGBoost
Przed kilkoma tygodniami zainicjowałem na blogu cykl: „zaawansowana analityka”. Czas więc wytoczyć duże działa. Użyję ich do spekulacji nad sensownością połączenia XGBoost + scoring kredytowy z uwzględnieniem pewnych założeń. Zapraszam! 🙂
Darmowy poradnik: Uczenie maszynowe. Sekrety doboru odpowiedniego algorytmu
Przez kilka ostatnich tygodni pracowałem po godzinach, by zebrać w jednym miejscu wiedzę dotyczącą algorytmów uczenia maszynowego. Dziś chciałbym Ci drogi czytelniku udostępnić rezultaty moich prac.
DSP 004: Kategoryzacja zmiennych z użyciem drzewa decyzyjnego
W poprzednich odcinkach ustaliliśmy metodę pozwalającą na dobór odpowiedniego punkt odcięcia. Teraz pora na poprawę rentowności i jakości modelu. Użyję do tego drzewa decyzyjnego, które wiele wnosi do modelu regresji. Zapraszam do obejrzenia!
Eksploracyjna analiza danych w 5 krokach
Niezależnie od tego, czy pracujesz jako data scientist, analityk danych, czy statystyk, zrozumienie danych jest kluczem do sukcesu.