Opis
Najważniejsze informacje o szkoleniu:
- Forma – szkolenie zostanie przeprowadzone w 100% online. Oznacza to, że prowadzący będzie prezentować i omawiać wszystkie zagadnienia na żywo z pomocą narzędzia do wideokonferencji.
- Adresaci – osoby, które są na początku kariery zawodowej, lub osoby nieco bardziej doświadczone, a które to chcą uaktualnić swoją wiedzę związaną z Data Science o najlepsze praktyki i aktualne standardy panujące w branży. Wymagana znajomość podstaw języka Python. Szkolenie zaczynamy z poziomu podstawowego, a kończymy na poziomie średniozaawansowanym.
- Narzędzia – wszelkie niezbędne narzędzia dostarcza organizator szkolenia.
- Połączenie zdalne – zostanie zrealizowane z użyciem oprogramowania Microsoft Teams.
- Obliczenia i uruchamianie kodu – wszyscy uczestnicy otrzymają dostęp do prekonfigurowanych maszyn wirtualnych osadzonych w chmurze (z zainstalowanym niezbędnym oprogramowaniem Jupyter i bibliotekami). Dostęp do maszyn będzie możliwy z użyciem standardowej przeglądarki internetowej.
- Czas trwania – 18 godzin czystej nauki, na które składają się:
- Sesje szkoleniowe – 3 dni po 6 godzin (wliczając przerwy 3 x 10 minut każdego dnia).
- Termin
- Wrzesień 2023 – więcej info wkrótce!
- Cena – 999 zł. „Data Science Plus Mateusz Grzyb” nie jest płatnikiem VAT, więc cena netto = brutto.
Masz pytania? Napisz do mnie: kontakt@mateuszgrzyb.pl
Agenda
Dzień 1
- Wprowadzenie.
- Kwestie organizacyjne.
- Czym jest Data Science? Czym się różni od AI, ML, statystyki?
- Data Scientist – charakterystyka, jak myśli, działa i rozwiązuje problemy?
- Elementy wpływające na efektywność pracy.
- Python – wady i zalety.
- Omówienie niezbędnych bibliotek.
- Przygotowanie „idealnego” środowiska pracy.
- PEP 8, czyli gramatyka dla programisty.
- Antykruche podejście do kodowania.
- Zarządzanie skryptem.
- Przygotowanie i przekształcanie danych.
- Zaawansowane struktury danych (Series, Data Frame).
- Czytanie danych (m.in. pliki płaskie, Excel, etc.).
- Łączenie zbiorów.
- Filtrowanie zbioru.
- Próbkowanie.
- Obsługa brakujących wartości.
- Zmiana kształtu danych.
- Grupowanie danych.
- Zapisywanie danych.
Dzień 2
- Praktyczne elementy statystyki.
- Podsumowanie danych ilościowych.
- Podsumowanie danych jakościowych.
- Analiza jednowymiarowa – badanie właściwości rozkładu zmiennej.
- Analiza wielowymiarowa – badanie zależności pomiędzy zmiennymi.
- Wprowadzenie do modelowania.
- Cel modelowania.
- Typy problemów, z jakimi się mierzymy w modelowaniu.
- Miary sukcesu w modelowaniu.
- Model jako uproszczenie rzeczywistości.
- Błąd vs wariancja.
- Modelowanie parametryczne.
- Wprowadzenie do regresji.
- Regresja liniowa jako preludium do zaawansowanych algorytmów ML.
- Regresja założenie i ograniczenia.
- Model liniowy z jedną zmienną.
- Model liniowy z wieloma zmiennymi.
- Wnioskowanie parametryczne.
Dzień 3
- Modelowanie nieparametryczne.
- Wprowadzenie do modeli drzewiastych.
- Drzewo decyzyjne jako preludium do zaawansowanych algorytmów ML.
- Drzewo decyzyjne – założenia i ograniczenia.
- Model drzewiasty – optymalizacja parametrów.
- Interpretacja wyników.
- Modelowanie – podsumowanie.
- Proces budowy rozwiązania ML.
- Wybór algorytmu.
- Kiedy powiedzieć „dość”?
- Umiejętności miękkie w Data Science.
- Mentalność badacza (metoda SDP).
- Umiejętność planowania i zarządzania procesem analitycznym.
- Podsumowanie i rekomendacje.
- Materiały do samodzielnej nauki.
- Rekomendowane książki.
- Rekomendowane publikacje.