Przed kilkoma tygodniami zainicjowałem na blogu cykl: „zaawansowana analityka”. Czas więc wytoczyć duże działa. Użyję ich do spekulacji nad sensownością połączenia XGBoost + scoring kredytowy z uwzględnieniem pewnych założeń. Zapraszam! 🙂
projekt
Segmentacja behawioralna klientów z użyciem metody RFM
Segmentacja wcale nie musi być skomplikowana. Najważniejszy jest jej efekt i korzyści jakie przynosi dla firmy. W tym projekcie chciałbym pokazać jak szybko, łatwo i przyjemnie wykonać segmentacje behawioralną z użyciem relatywnie prostych metod. Zapraszam! 🙂
Segmentacja pokemonów, czyli wpis z okazji Międzynarodowego Dnia Dziecka
Dziś w całej Polsce obchodzimy Międzynarodowy Dzień Dziecka. Z tej okazji publikuję nietypowy wpis w którym wykonuję grupowanie Pokemonów. 😉
Kto wygra finał mistrzostw świata w piłce nożnej 2018?
W ostatnich tygodniach cały świat ogarnęło piłkarskie święto. Myślę, że wszyscy zastanawiamy się, kto przez kolejne cztery lata będzie nosić tytuł mistrza. Piłkarska gorączka dotarła również na mojego bloga i wyjątkowo odkładam dziś na bok tematy związane z szeroko rozumianym biznesem i postaram się przewidzieć wynik finałowego meczu. 🙂 Wstęp Cel projektu Założenia dotyczące projektu … Dowiedz się więcej
Przewidywanie defaultu wśród posiadaczy kart kredytowych
Ostatni projekt, który publikowałem na blogu, dotyczył klasyfikacji wniosków o wydanie karty kredytowej. Z pomocą uczenia maszynowego starałem się w nim odzwierciedlić decyzje, jakie podejmują eksperci pracujący w banku. Dziś idę o krok dalej i pokażę, jak można przewidzieć zdarzenie niewypłacalności posiadaczy kart kredytowych. Wstęp Cel projektu Założenia dotyczące projektu Opis zbioru danych Wczytanie i … Dowiedz się więcej
Klasyfikacja wniosków o wydanie karty kredytowej
Być może zastanawiałeś się kiedyś nad tym, jakie korzyści niesie ze sobą wdrożenie w organizacji rozwiązania opartego o uczenie maszynowe. Optymalizacja kosztów, przewaga nad konkurencją i możliwość zarządzania ryzykiem to te, które jako pierwsze przychodzą mi do głowy. Jest jednak jeszcze jeden szalenie ważny aspekt, który choć bardzo podstawowy, często jest zapominany.
Przepowiednie wyroczni z Omaha
Warren Buffett jest jednym z najbardziej znanych inwestorów na świecie. Uczeń słynnego Benjamina Grahama nosi przydomek „wyrocznia z Omaha”. Zawdzięcza go trafnym decyzjom inwestycyjnym, jakie podejmował na przestrzeni ostatnich kilkudziesięciu lat.
Większość wspomnianych decyzji odnosi się do Berkshire Hathaway, którym Buffett zarządza. Holding ten regularnie osiąga świetnie wyniki i z łatwością „pokonuje” rynek. Jako CEO, Buffett co roku dzieli się z akcjonariuszami otwartymi listami. Ich treść podsumowuje miniony rok i odnosi się do perspektyw na kolejne lata. Zatem być może właśnie w nich jest zawarta przynajmniej część recepty na sukces.
Największy przeciwnik króla boksu
Chyba każdy z nas miał lub nadal ma w swoim życiu osobistego bohatera. Osobę, którą inspirował się od najmłodszych lat. Wzór do naśladowania, którego dokonania wywierały wpływ na nasze życie.
Mój „bohater” dokładnie dziś kończyłby 76 lat. Muhammad Ali, bo o nim mowa, był prawdziwym królem boksu. Jest powszechnie uważany przez ekspertów za najlepszego boksera w historii, a przydomek jaki nosił – „The Greatest” – mówi w zasadzie wszystko o jego karierze.
Klasyfikacja pasażerów Titanica
Projekt ten jest kontynuacją wpisu wprowadzającego do Microsoft Azure Machine Learning. W oparciu o rzeczywisty zbiór danych, zbuduję przykładowy model predykcyjny. Przy poprzednim projekcie założyłem, iż kolejny eksperyment będzie pokazywać inną technologię. Po epizodzie z open source, dziś czas na rozwiązanie Microsoft.
Jako motyw przewodni tego projektu wybrałem jeden z najpopularniejszych konkursów Kaggle. Jako że jest to oficjalny konkurs, to będę mógł „sprawdzić się” w rywalizacji z ponad 6000 zespołów które wzięły w nim udział.
Silnik rekomendacji filmów
Bardzo popularny temat w środowisku data science: wyznaczanie rekomendacji. Jeśli mowa o rekomendacjach to wybór zbioru danych nie może być inny niż zbiór filmów i ich atrybutów. Klasyka Data Miningu 🙂 Jeśli chcesz zobaczyć proces implementacji zbiorów rozmytych w silniku rekomendacji, to zapraszam do zapoznania się z treścią wpisu.