Książki, które polecam

książki, które polecam

Jedno z najczęściej zadawanych pytań przez Was to: „Jakie książki polecasz?”. W tym wpisie udzielam na nie odpowiedzi. Z tego artykułu dowiesz się: 1. Jak czytam książki? 2. Czemu ciągle rozwijam umiejętności miękkie? 3. Jakie książki polecam? Uwielbiam książki. Kupuję i pożyczam więcej książek, niż jestem w stanie przeczytać. Dla mnie stanowią one prawdziwą skarbnicę … Dowiedz się więcej

Kategoryzacja zmiennych z użyciem drzewa decyzyjnego

binning, kategoryzacja drzewem, kategoryzacja zmiennych, uczenie maszynowe, sztuczna inteligencja, python, drzewo decyzyjne

W uczeniu maszynowym istnieje kilka relatywnie prostych metod, które pomimo prostoty dają świetne rezultaty. Jedną z nich jest z pewnością kategoryzacja zmiennych z użyciem drzewa decyzyjnego. Z tego artykułu dowiesz się: 1. Czym jest kategoryzacja zmiennych? 2. Jak kategoryzować zmienne z użyciem algorytmu drzewa decyzyjnego? 3. Jak osiągnąć znaczną poprawę wyniku, unikając przecieków danych i … Dowiedz się więcej

Kto wygra finał mistrzostw świata w piłce nożnej 2018?

piłka nożna, przewidywanie wyniku, python, sztuczna inteligencja, data science

W ostatnich tygodniach cały świat ogarnęło piłkarskie święto. Myślę, że wszyscy zastanawiamy się, kto przez kolejne cztery lata będzie nosić tytuł mistrza. Piłkarska gorączka dotarła również na mojego bloga i wyjątkowo odkładam dziś na bok tematy związane z szeroko rozumianym biznesem i postaram się przewidzieć wynik finałowego meczu. 🙂 Wstęp Cel projektu Założenia dotyczące projektu … Dowiedz się więcej

Przewidywanie defaultu wśród posiadaczy kart kredytowych

credit scoring z użyciem regresji logistycznej Python

Ostatni projekt, który publikowałem na blogu, dotyczył klasyfikacji wniosków o wydanie karty kredytowej. Z pomocą uczenia maszynowego starałem się w nim odzwierciedlić decyzje, jakie podejmują eksperci pracujący w banku. Dziś idę o krok dalej i pokażę, jak można przewidzieć zdarzenie niewypłacalności posiadaczy kart kredytowych. Wstęp Cel projektu Założenia dotyczące projektu Opis zbioru danych Wczytanie i … Dowiedz się więcej

7 najczęstszych błędów w Data Science

nawyki, data science, błędy, umiejętności miękkie, teoria, praktyka

Nie ma żadnych wątpliwości – wszystkim nam zdarzają się pomyłki. Dziś przygotowałem listę siedmiu najczęściej popełnianych błędów przez osoby pracujące z danymi. Na początku dodam niewielkie zastrzeżenie. Do tej pory we wszystkich wpisach na moim blogu starałem się być możliwie obiektywny. Ten jest zupełnie inny. Przygotowana lista, to w 100% mój subiektywny wybór, dlatego proszę, … Dowiedz się więcej

5 sposobów na radzenie sobie z dużymi zbiorami danych w Python

błąd, python, duży zbiór, data science, pandas

Chyba każdy programista Python analizujący duże zbiory danych, chociaż raz spotkał się w swojej pracy z błędem „out of memory”. Jak sobie z nim radzić? Z tego artykułu dowiesz się: 1. Czemu Pandas ma problem z dużymi zbiorami? 2. Jakie są dobre praktyki pracy z dużymi danymi w Pythonie? 3. Jakie przetwarzać duże zbiory z … Dowiedz się więcej

Jak przygotować model przed wdrożeniem do produkcji?

wdrożenie modelu na produkcję

W literaturze można znaleźć mnóstwo przykładów opisujących kolejne etapy procesu modelowania danych. Większość z nich kończy się jednak w chwili, gdy model osiąga zadowalającą jakość, a jego przygotowanie pod wdrożenie produkcyjne jest niestety zazwyczaj pomijane, lub opisywane przez autorów bez należytej staranności. Z tego artykułu dowiesz się: 1. Czym jest model produkcyjny? 2. Jak w … Dowiedz się więcej

2 proste i skuteczne metody optymalizacji parametrów modelu

optymalizacja parametrów modelu, data science, python, sklearn

Większość algorytmów używanych w uczeniu maszynowym podlega procesowi parametryzacji. Oznacza to, że możemy wpływać na ich dopasowanie do danych z pomocą zestawu dostępnych parametrów. Z tego artykułu dowiesz się: 1. Jakie metody doboru parametrów wykorzystuję najczęściej? 2. Jakie korzyści płyną z ich użycia? 3. Jakie są ich wady i zalety? 4. Jak możesz optymalizować parametry … Dowiedz się więcej