Chciałbym podzielić się z Tobą mini projektem, który wykonałem w październiku 2022 roku, tuż po obejrzeniu Tesla AI Day 2022.
python
Podsumowanie 1. edycji szkolenia „Wprowadzenie do Data Science z Python”
Niedawno zakończyłem pierwszą edycję mojego autorskiego szkolenia. Chciałbym się z Tobą podzielić krótką relacją z procesu jego tworzenia i podsumowaniem jego przebiegu.
Jak wczytać plik płaski w Python z pomocą biblioteki Pandas?
Czytanie danych – jedna z podstawowych czynności w data science. Każdy, kto na co dzień pracuje z danymi, wykona ją w swoim życiu zawodowym setki (o ile nie tysiące) razy. Warto zatem wiedzieć jak robić to w sposób prawidłowy.
Eksploracyjna analiza danych w 5 krokach
Niezależnie od tego, czy pracujesz jako data scientist, analityk danych, czy statystyk, zrozumienie danych jest kluczem do sukcesu.
Jaki język programowania wybrać?
Dylemat początkującego: jaki języka programowania używany w Data Science wybrać? Poniżej odpowiadam na pytanie spędzające sen z powiek u młodych Data Scientist-ów.
Kategoryzacja zmiennych z użyciem drzewa decyzyjnego
W uczeniu maszynowym istnieje kilka relatywnie prostych metod, które pomimo prostoty dają świetne rezultaty. Jedną z nich jest z pewnością kategoryzacja zmiennych z użyciem drzewa decyzyjnego. Z tego artykułu dowiesz się: 1. Czym jest kategoryzacja zmiennych? 2. Jak kategoryzować zmienne z użyciem algorytmu drzewa decyzyjnego? 3. Jak osiągnąć znaczną poprawę wyniku, unikając przecieków danych i … Dowiedz się więcej
Kto wygra finał mistrzostw świata w piłce nożnej 2018?
W ostatnich tygodniach cały świat ogarnęło piłkarskie święto. Myślę, że wszyscy zastanawiamy się, kto przez kolejne cztery lata będzie nosić tytuł mistrza. Piłkarska gorączka dotarła również na mojego bloga i wyjątkowo odkładam dziś na bok tematy związane z szeroko rozumianym biznesem i postaram się przewidzieć wynik finałowego meczu. 🙂 Wstęp Cel projektu Założenia dotyczące projektu … Dowiedz się więcej
Przewidywanie defaultu wśród posiadaczy kart kredytowych
Ostatni projekt, który publikowałem na blogu, dotyczył klasyfikacji wniosków o wydanie karty kredytowej. Z pomocą uczenia maszynowego starałem się w nim odzwierciedlić decyzje, jakie podejmują eksperci pracujący w banku. Dziś idę o krok dalej i pokażę, jak można przewidzieć zdarzenie niewypłacalności posiadaczy kart kredytowych. Wstęp Cel projektu Założenia dotyczące projektu Opis zbioru danych Wczytanie i … Dowiedz się więcej
5 sposobów na radzenie sobie z dużymi zbiorami danych w Python
Chyba każdy programista Python analizujący duże zbiory danych, chociaż raz spotkał się w swojej pracy z błędem „out of memory”. Jak sobie z nim radzić? Z tego artykułu dowiesz się: 1. Czemu Pandas ma problem z dużymi zbiorami? 2. Jakie są dobre praktyki pracy z dużymi danymi w Pythonie? 3. Jakie przetwarzać duże zbiory z … Dowiedz się więcej
2 proste i skuteczne metody optymalizacji parametrów modelu
Większość algorytmów używanych w uczeniu maszynowym podlega procesowi parametryzacji. Oznacza to, że możemy wpływać na ich dopasowanie do danych z pomocą zestawu dostępnych parametrów. Z tego artykułu dowiesz się: 1. Jakie metody doboru parametrów wykorzystuję najczęściej? 2. Jakie korzyści płyną z ich użycia? 3. Jakie są ich wady i zalety? 4. Jak możesz optymalizować parametry … Dowiedz się więcej