Pierwszy konkurs i pierwsza ankieta w historii bloga. Planuję spore zmiany, w związku z tym chciałbym prosić Cię o małą pomoc. 🙂
Mateusz Grzyb
Blogi, które polecam
Kontynuuję temat rozpoczęty przy okazji wpisu: Książki, które polecam i dziś dzielę się z Wami moimi ulubionymi blogami.
Książki, które polecam
Jedno z najczęściej zadawanych pytań przez Was to: „Jakie książki polecasz?”. W tym wpisie udzielam na nie odpowiedzi. Z tego artykułu dowiesz się: 1. Jak czytam książki? 2. Czemu ciągle rozwijam umiejętności miękkie? 3. Jakie książki polecam? Uwielbiam książki. Kupuję i pożyczam więcej książek, niż jestem w stanie przeczytać. Dla mnie stanowią one prawdziwą skarbnicę … Dowiedz się więcej
Kategoryzacja zmiennych z użyciem drzewa decyzyjnego
W uczeniu maszynowym istnieje kilka relatywnie prostych metod, które pomimo prostoty dają świetne rezultaty. Jedną z nich jest z pewnością kategoryzacja zmiennych z użyciem drzewa decyzyjnego. Z tego artykułu dowiesz się: 1. Czym jest kategoryzacja zmiennych? 2. Jak kategoryzować zmienne z użyciem algorytmu drzewa decyzyjnego? 3. Jak osiągnąć znaczną poprawę wyniku, unikając przecieków danych i … Dowiedz się więcej
Kto wygra finał mistrzostw świata w piłce nożnej 2018?
W ostatnich tygodniach cały świat ogarnęło piłkarskie święto. Myślę, że wszyscy zastanawiamy się, kto przez kolejne cztery lata będzie nosić tytuł mistrza. Piłkarska gorączka dotarła również na mojego bloga i wyjątkowo odkładam dziś na bok tematy związane z szeroko rozumianym biznesem i postaram się przewidzieć wynik finałowego meczu. 🙂 Wstęp Cel projektu Założenia dotyczące projektu … Dowiedz się więcej
Przewidywanie defaultu wśród posiadaczy kart kredytowych
Ostatni projekt, który publikowałem na blogu, dotyczył klasyfikacji wniosków o wydanie karty kredytowej. Z pomocą uczenia maszynowego starałem się w nim odzwierciedlić decyzje, jakie podejmują eksperci pracujący w banku. Dziś idę o krok dalej i pokażę, jak można przewidzieć zdarzenie niewypłacalności posiadaczy kart kredytowych. Wstęp Cel projektu Założenia dotyczące projektu Opis zbioru danych Wczytanie i … Dowiedz się więcej
7 najczęstszych błędów w Data Science
Nie ma żadnych wątpliwości – wszystkim nam zdarzają się pomyłki. Dziś przygotowałem listę siedmiu najczęściej popełnianych błędów przez osoby pracujące z danymi. Na początku dodam niewielkie zastrzeżenie. Do tej pory we wszystkich wpisach na moim blogu starałem się być możliwie obiektywny. Ten jest zupełnie inny. Przygotowana lista, to w 100% mój subiektywny wybór, dlatego proszę, … Dowiedz się więcej
5 sposobów na radzenie sobie z dużymi zbiorami danych w Python
Chyba każdy programista Python analizujący duże zbiory danych, chociaż raz spotkał się w swojej pracy z błędem „out of memory”. Jak sobie z nim radzić? Z tego artykułu dowiesz się: 1. Czemu Pandas ma problem z dużymi zbiorami? 2. Jakie są dobre praktyki pracy z dużymi danymi w Pythonie? 3. Jakie przetwarzać duże zbiory z … Dowiedz się więcej
Jak przygotować model przed wdrożeniem do produkcji?
W literaturze można znaleźć mnóstwo przykładów opisujących kolejne etapy procesu modelowania danych. Większość z nich kończy się jednak w chwili, gdy model osiąga zadowalającą jakość, a jego przygotowanie pod wdrożenie produkcyjne jest niestety zazwyczaj pomijane, lub opisywane przez autorów bez należytej staranności. Z tego artykułu dowiesz się: 1. Czym jest model produkcyjny? 2. Jak w … Dowiedz się więcej
2 proste i skuteczne metody optymalizacji parametrów modelu
Większość algorytmów używanych w uczeniu maszynowym podlega procesowi parametryzacji. Oznacza to, że możemy wpływać na ich dopasowanie do danych z pomocą zestawu dostępnych parametrów. Z tego artykułu dowiesz się: 1. Jakie metody doboru parametrów wykorzystuję najczęściej? 2. Jakie korzyści płyną z ich użycia? 3. Jakie są ich wady i zalety? 4. Jak możesz optymalizować parametry … Dowiedz się więcej