Dla wszystkich nowych i obecnych subskrybentów bloga przygotowałem niespodziankę: darmowe szkolenie w formie screencastu. Jego tematem jest pewna niebanalna technika, która potrafi w sposób znaczący wpłynąć na jakość modelu. 🙂
Pomysł na screencast (czyli webinar „z odtworzenia” w którym udostępniam swój pulpit i omawiam poszczególne techniki) zrodził się kilka tygodni temu. Kończąc prace nad ostatnim z serii odcinków Data Science Plus, przyszedł mi do głowy jeszcze jeden pomysł na poprawę osiągniętego wyniku.
Po kilku testach na badanym zbiorze okazało się, że wspomniana niebanalna technika pozwala poprawić jakość modelu regresji logistycznej na tyle mocno, że zbliża się on do wyniku osiągniętego przez wysublimowany model XGBoost.
Wyniki kolejnych modeli (statystyka Giniego):
- XGBoost + Boruta + kategoryzacja zmiennych – ok. 58.0
- Las Losowy – ok. 57.8
- Regresja logistyczna + kategoryzacja zmiennych + WoE – ok. 56.3
- Regresja logistyczna na sterydach – ok. 57.5 🙂
Wspomnianymi „sterydami” są metody badania interakcji pomiędzy zmiennymi. Pozwalają one zawrzeć odkrytą wiedzę w zbiorze w sposób „czytelny” dla modeli liniowych. Wpływa to w sposób znaczący na poprawę wyniku.
Jeśli chcesz dołączyć do subskrybentów bloga i otrzymać 2 prezenty (screencast „Badanie interakcji pomiędzy zmiennymi” i poradnik „10 kroków do lepszego zrozumienia danych”) w 100% za darmo, to nie zwlekaj – będzie on dostępny dla nowych subskrybentów bloga tylko do końca lipca.
Aktualizacja
Zgodnie z zapowiedzią screencast już nie jest dostępny. Jeśli tylko chcesz, dołącz do subskrybentów bloga, a powiadomię Cię w momencie, gdy opublikuję jego kolejną wersję. W prezencie otrzymasz inny poradnik: „10 kroków do lepszego zrozumienia danych.” 🙂 [FM_form id=”6″]
PODOBAŁ CI SIĘ TEN ARTYKUŁ?
Jeśli tak, to zarejestruj się, by otrzymywać informacje o nowych wpisach.
Dodatkowo w prezencie wyślę Ci bezpłatny poradnik :-)
Dodaj komentarz