Jakiego narzędzia powinienem użyć do tego projektu? Które z nich zapewni mi odpowiednią skalowalność i szybkość? – te pytania powtarzane są na forach związanych z analizą i przetwarzaniem danych. I nic dziwnego. Liczba rozwiązań z rodziny uczenia maszynowego, które są dostępne na rynku potrafi przyprawić o zawrót głowy.
W samym środowisku Microsoft dostępnych jest cała masa narzędzi służących do składowania, przetwarzania i wizualizacji danych. Sprawia to, że wiele osób ma problem z wyborem odpowiedniego narzędzia dopasowanego zarówno do potrzeb zespołu jak i skali problemu z jakim się borykają. Ten problem wraz z zagadnieniem skalowalności poszczególnych rozwiązań był przeze mnie poruszany w dniu wczorajszym na spotkaniu Microsoft Azure User Group.
Motywem przewodnim zarówno całego spotkania jak i mojej prezentacji był Machine Learning w chmurze Microsoft Azure. Cała prezentacja podzielona była na trzy części:
- Na początku skupiłem się na opisaniu zagadnienia Machine Learningu. Omówiłem jego wpływ na rozwój sztucznej inteligencji i w skrócie przedstawiłem sposób grupowania problemów które mogą być rozwiązane za pomocą uczenia maszynowego. Przedstawiłem również metody mierzenia wydajności algorytmów klasyfikacyjnych.
- W części drugiej zaprezentowałem gamę narzędzi i usług z rodziny ML Microsoft Azure. Skupiłem się na mocnych stronach każdego z nich i zasugerowałem w jakich scenariuszach biznesowych powinny być wykorzystywane (np. kiedy należy użyć Azure ML Studio, a kiedy raczej postawić na zbudowanie klastra złożonego z kilku maszyn wirtualnych i przetwarzanie zrównoleglone).
- Na końcu mojej prezentacji przestawiłem schemat budowy rozwiązania wykorzystującego uczenie maszynowe. Bazowałem na jednym z projektów, które opisywałem na łamach bloga.
Jeśli nie miałeś okazji uczestniczyć w prezentacji, to nic straconego. Całe spotkanie było nagrywane, więc organizatorzy pewnie udostępnią je w najbliższym czasie. Linki do moich slajdów, oraz wszystkich materiałów o których wspominałem znajdują się poniżej.
Materiały z prezentacji:
Prezentacja w formacie .pptx
Prezentacja w formacie .pdf
Bibliografia + strony wspomniane przeze mnie podczas prezentacji:
Wprowadzenie do MicrosoftML
Maszyny wirtualne w Microsoft Azure
Azure Data Science Virtual Machine
Azure DSVM na GitHub
Microsoft Data Science Process
Uzupełnianie brakujących wartości z użyciem MICE
Biblioteka AzureML w R
PODOBAŁ CI SIĘ TEN ARTYKUŁ?
Jeśli tak, to zarejestruj się, by otrzymywać informacje o nowych wpisach.
Dodatkowo w prezencie wyślę Ci bezpłatny poradnik :-)
Dodaj komentarz