Przed kilkoma tygodniami zainicjowałem na blogu cykl: „zaawansowana analityka”. Czas więc wytoczyć duże działa. Użyję ich do spekulacji nad sensownością połączenia XGBoost + scoring kredytowy z uwzględnieniem pewnych założeń. Zapraszam! 🙂
klasyfikacja
DSP 004: Kategoryzacja zmiennych z użyciem drzewa decyzyjnego
W poprzednich odcinkach ustaliliśmy metodę pozwalającą na dobór odpowiedniego punkt odcięcia. Teraz pora na poprawę rentowności i jakości modelu. Użyję do tego drzewa decyzyjnego, które wiele wnosi do modelu regresji. Zapraszam do obejrzenia!
DSP 003: Wybór odpowiedniego punktu odcięcia – metoda uwzględniająca założenia biznesowe
Jak wybrać punkt odcięcia i uwzględnić uwarunkowania biznesowe, by maksymalizować zysk i minimalizować stratę? O tym wszystkim opowiadam w trzecim odcinku DSP. Serdecznie zapraszam do obejrzenia!
Jak wybrać punkt odcięcia, bazując na uwarunkowaniach biznesowych?
W ostatnich wpisach pokazywałem jak wybrać punkt odcięcia przy założeniu, że wszystkie popełniane błędy kosztują nas tyle samo. W poniższym wpisie przedstawiam metodę biorącą pod uwagę uwarunkowania biznesowe.
DSP 002: Wybór odpowiedniego punktu odcięcia – metoda „złotego środka”
W drugim odcinku na kanale Data Science Plus poruszam temat wyboru odpowiedniego punktu odcięcia.
Prosty sposób na wybór odpowiedniego punktu odcięcia – praktyka
Wybór odpowiedniego punktu odcięcia wcale nie musi być trudny. Poniżej na przykładzie z sektora finansowego pokazuję jak to zrobić w kilku prostych krokach.
Klasyfikacja wniosków o wydanie karty kredytowej
Być może zastanawiałeś się kiedyś nad tym, jakie korzyści niesie ze sobą wdrożenie w organizacji rozwiązania opartego o uczenie maszynowe. Optymalizacja kosztów, przewaga nad konkurencją i możliwość zarządzania ryzykiem to te, które jako pierwsze przychodzą mi do głowy. Jest jednak jeszcze jeden szalenie ważny aspekt, który choć bardzo podstawowy, często jest zapominany.
Klasyfikacja pasażerów Titanica
Projekt ten jest kontynuacją wpisu wprowadzającego do Microsoft Azure Machine Learning. W oparciu o rzeczywisty zbiór danych, zbuduję przykładowy model predykcyjny. Przy poprzednim projekcie założyłem, iż kolejny eksperyment będzie pokazywać inną technologię. Po epizodzie z open source, dziś czas na rozwiązanie Microsoft.
Jako motyw przewodni tego projektu wybrałem jeden z najpopularniejszych konkursów Kaggle. Jako że jest to oficjalny konkurs, to będę mógł „sprawdzić się” w rywalizacji z ponad 6000 zespołów które wzięły w nim udział.