
Natknąłem się na bardzo ciekawe rozwiązanie, które w sposób automatyczny dopasowuje model do wybranego problemu. MLJAR, bo o nim mowa, jest platformą do automatycznego budowania modeli predykcyjnych, która nawet początkującym pomoże osiągnąć znakomite rezultaty Budowanie eksperymentu w MLJAR jest banalnie proste i sprowadza się do kilku kroków:
- Tworzenie nowego projektu.
- Dodanie zbioru uczącego i testowego
- Wybranie kolumn które będą brane pod uwagę przy budowaniu modelu predykcyjnego.
- Wybranie parametrów eksperymentu:
- Typ walidacji.
- Metrykę według której model będzie optymalizowany.
- Liczbę modeli do zbudowania.
- Algorytmy do wykorzystania (Extreme Gradient Boosting, Radom Forrest, Regularized Greedy Forest, Extra Trees, KNN, Logistic Regression, Neural Network, Ensemble Averaging)
- Limit czasu na uczenie pojedynczego modelu.
- Rozpoczęcie eksperymentu eksperyment (w tym momencie mechanizm buduje wiele modeli opartych o parametry i algorytmy przez nas zdefiniowane).
- Sprawdzenie wyników i wybranie najlepszego modelu.
- Wyznaczenie predykcji w oparciu o najlepszy model.
Po kilkudziesięciu minutach przygotowań i kilku godzinach wykonywania eksperymentu możemy uzyskać wynik pozwalający nam znaleźć się w czołówce rankingu na Kaggle. Dowodem jest poniższe w wideo, w którym autor wziął udział (po terminie, w związku z czym nie widnieje w oficjalnym rankingu) w konkursie: Give Me Some Credit.
Kilka prostych kroków pozwoliło mu osiągnąć wynik AUC = 0.869097. Gdyby konkurs był ciągle aktywny plasowałoby go to na… 6 miejscu spośród ponad 900 zespołów! Całkiem nieźle jak na kilka minut zabawy
Autor porównał MLJAR do kilku innych rozwiązań umożliwiających budowanie rozwiązań ML, m.in. Google i Amazon (inspiracją do tego porównania był artykuł „Machine Learning Wars” z KDnuggets). O dziwo MLJAR na tle dużych konkurentów wypada zadziwiająco dobrze.
Jeżeli powyższy przykład wydał Ci się interesujący, to nieco więcej na temat tego rozwiązania możesz się dowiedzieć z oficjalnej strony MLJAR.
PODOBAŁ CI SIĘ TEN ARTYKUŁ?
Jeśli tak, to zarejestruj się, by otrzymywać informacje o nowych wpisach.
Dodatkowo w prezencie wyślę Ci bezpłatny poradnik :-)
Ostatnio bawiłem się chwilę AutoKeras’em (https://autokeras.com) i nawet odpalając przykład, który jest w dokumentacji, wyniki były dosyć słabe…
Dzięki za wstawkę o tym projekcie, sprawdzę sobie w wolnej chwili
Pozdrawiam,
Konrad
Hej Konrad!
Nigdy nie słyszałem o AutoKeras, więc dziękuję za informację. Być może słabsze niż oczekiwałeś wyniki, to kwestia danych, lub charakterystyka problemu, który chciałeś rozwiązać? Tak czy inaczej, dodaję ją do listy bibliotek do przetestowania 
Dzień dobry! Panie Mateuszu, jestem kompletnym laikiem – nie rozumiem 80% tematu, wiec proszę o wyrozumiałość. Mam jedno pytanie: czy aby brać udział w konkursach na Kaggle trzeba umieć programować? Jeśli tak – w jakim języku/technologii? Chciałabym pracować w obszarze AI, automatyzacji itp. i szukam informacji, jak się za to zabrać i tak jakoś trafiłam na Pana blog
Dzień dobry!
Tak, raczej trzeba umieć programować. Najlepiej język Python, lub R. Proszę rzucić okiem na moje przykładowe projekty wykonane w języku Python: https://mateuszgrzyb.pl/tag/projekt/
Tłumaczę w nich krok po kroku, co należy zrobić, by zbudować model.
Serdecznie pozdrawiam i trzymam za Panią kciuki!