Kategoryzacja zmiennych z użyciem drzewa decyzyjnego

binning, kategoryzacja drzewem, kategoryzacja zmiennych, uczenie maszynowe, sztuczna inteligencja, python, drzewo decyzyjne

W uczeniu maszynowym istnieje kilka relatywnie prostych metod, które pomimo prostoty dają świetne rezultaty. Jedną z nich jest z pewnością kategoryzacja zmiennych z użyciem drzewa decyzyjnego. Z tego artykułu dowiesz się: 1. Czym jest kategoryzacja zmiennych? 2. Jak kategoryzować zmienne z użyciem algorytmu drzewa decyzyjnego? 3. Jak osiągnąć znaczną poprawę wyniku, unikając przecieków danych i … Dowiedz się więcej

Kto wygra finał mistrzostw świata w piłce nożnej 2018?

piłka nożna, przewidywanie wyniku, python, sztuczna inteligencja, data science

W ostatnich tygodniach cały świat ogarnęło piłkarskie święto. Myślę, że wszyscy zastanawiamy się, kto przez kolejne cztery lata będzie nosić tytuł mistrza. Piłkarska gorączka dotarła również na mojego bloga i wyjątkowo odkładam dziś na bok tematy związane z szeroko rozumianym biznesem i postaram się przewidzieć wynik finałowego meczu. 🙂 Wstęp Cel projektu Założenia dotyczące projektu … Dowiedz się więcej

Przewidywanie defaultu wśród posiadaczy kart kredytowych

credit scoring z użyciem regresji logistycznej Python

Ostatni projekt, który publikowałem na blogu, dotyczył klasyfikacji wniosków o wydanie karty kredytowej. Z pomocą uczenia maszynowego starałem się w nim odzwierciedlić decyzje, jakie podejmują eksperci pracujący w banku. Dziś idę o krok dalej i pokażę, jak można przewidzieć zdarzenie niewypłacalności posiadaczy kart kredytowych. Wstęp Cel projektu Założenia dotyczące projektu Opis zbioru danych Wczytanie i … Dowiedz się więcej

5 sposobów na radzenie sobie z dużymi zbiorami danych w Python

błąd, python, duży zbiór, data science, pandas

Chyba każdy programista Python analizujący duże zbiory danych, chociaż raz spotkał się w swojej pracy z błędem „out of memory”. Jak sobie z nim radzić? Z tego artykułu dowiesz się: 1. Czemu Pandas ma problem z dużymi zbiorami? 2. Jakie są dobre praktyki pracy z dużymi danymi w Pythonie? 3. Jakie przetwarzać duże zbiory z … Dowiedz się więcej

2 proste i skuteczne metody optymalizacji parametrów modelu

optymalizacja parametrów modelu, data science, python, sklearn

Większość algorytmów używanych w uczeniu maszynowym podlega procesowi parametryzacji. Oznacza to, że możemy wpływać na ich dopasowanie do danych z pomocą zestawu dostępnych parametrów. Z tego artykułu dowiesz się: 1. Jakie metody doboru parametrów wykorzystuję najczęściej? 2. Jakie korzyści płyną z ich użycia? 3. Jakie są ich wady i zalety? 4. Jak możesz optymalizować parametry … Dowiedz się więcej