Jak przyspieszyć Pythona jedną linijką kodu?

Chyba każda osoba pracująca z danymi chociaż raz w swoim życiu spotkała się z tym problemem: powolne ładowanie danych, które znacząco spowalnia proces analizy danych. Na niewiele zda się tu moc obliczeniowa, która nie rośnie aż tak szybko, jak wolumeny danych, z którymi pracujemy. Co zatem zrobić, jeśli nie chcemy wydawać górki pieniędzy na rozbudowę własnej infrastruktury, a usługi chmurowe nie wchodzą w grę? Okazuje się, że już wkrótce może się pojawić na to proste rozwiązanie.

Dowiedz się więcej

Jak w prosty sposób znaleźć się w czołówce rankingu wybranego konkursu na Kaggle?

Kaggle jest miejscem niemal mitycznym, gdzie bój między sobą toczą Data Scientist-ci z całego świata. Marzeniem każdego z nich jest znaleźć się w czołówce dowolnego konkursu, nie wspominając nawet o jego wygraniu. Wydawać by się mogło, że osiągnięcie tego celu graniczy z cudem i wymaga nie lada wysiłku. Okazuje się jednak, że istnieje droga na skróty. 🙂

Dowiedz się więcej

Microsoft Azure User Group #15

Jakiego narzędzia powinienem użyć do tego projektu? Które z nich zapewni mi odpowiednią skalowalność i szybkość? – te pytania powtarzane są na forach związanych z analizą i przetwarzaniem danych. I nic dziwnego. Liczba rozwiązań z rodziny uczenia maszynowego, które są dostępne na rynku potrafi przyprawić o zawrót głowy.

Dowiedz się więcej

Klasyfikacja pasażerów Titanica

Projekt ten jest kontynuacją wpisu wprowadzającego do Microsoft Azure Machine Learning. W oparciu o rzeczywisty zbiór danych, zbuduję przykładowy model predykcyjny. Przy poprzednim projekcie założyłem, iż kolejny eksperyment będzie pokazywać inną technologię. Po epizodzie z open source, dziś czas na rozwiązanie Microsoft.

Jako motyw przewodni tego projektu wybrałem jeden z najpopularniejszych konkursów Kaggle. Jako że jest to oficjalny konkurs, to będę mógł „sprawdzić się” w rywalizacji z ponad 6000 zespołów które wzięły w nim udział.

Dowiedz się więcej