3 najlepsze ściągawki z bibliotek Python

python, data science, sklearn

W dzisiejszych czasach cierpimy na przesyt informacji i możliwości. Problem ten przenosi się również na tematykę Data Science. Nawet najprostsze rzeczy da się zrobić na kilka sposobów. Mnogość bibliotek, metod i ich parametrów potrafi przyprawić o ból głowy. Niesłychanie ciężko jest to wszystko zapamiętać, dlatego jeśli tylko analizujesz dane w Pythonie, to mam dla Ciebie … Dowiedz się więcej

Klasyfikacja pasażerów Titanica

Projekt ten jest kontynuacją wpisu wprowadzającego do Microsoft Azure Machine Learning. W oparciu o rzeczywisty zbiór danych, zbuduję przykładowy model predykcyjny. Przy poprzednim projekcie założyłem, iż kolejny eksperyment będzie pokazywać inną technologię. Po epizodzie z open source, dziś czas na rozwiązanie Microsoft.

Jako motyw przewodni tego projektu wybrałem jeden z najpopularniejszych konkursów Kaggle. Jako że jest to oficjalny konkurs, to będę mógł „sprawdzić się” w rywalizacji z ponad 6000 zespołów które wzięły w nim udział.

Dowiedz się więcej

Niezbędnik każdego Data Scientist – Data Wrangling CheatSheet

Czy dokładnie pamiętasz wszystkie najpopularniejsze funkcje wykorzystywane w R do EDA? No właśnie, ja też nie. A przecież eksploracyjna analiza danych powinna być jednym z pierwszych kroków pracy z danymi. To dzięki niej poznajemy strukturę danych, wykonujemy badania przygotowawcze i stawiamy hipotezę będącą clou całego projektu. Bez wątpienia jest ona „fundamentem” każdego procesu badania danych. … Dowiedz się więcej