Dylemat początkującego: jaki języka programowania używany w Data Science wybrać? Poniżej odpowiadam na pytanie spędzające sen z powiek u młodych Data Scientist-ów.
R
Niezbędnik każdego Data Scientist – Data Wrangling CheatSheet
Czy dokładnie pamiętasz wszystkie najpopularniejsze funkcje wykorzystywane w R do EDA? No właśnie, ja też nie. A przecież eksploracyjna analiza danych powinna być jednym z pierwszych kroków pracy z danymi. To dzięki niej poznajemy strukturę danych, wykonujemy badania przygotowawcze i stawiamy hipotezę będącą clou całego projektu. Bez wątpienia jest ona „fundamentem” każdego procesu badania danych. … Dowiedz się więcej
Ściągawka z biblioteki ggplot2
Bez wątpienia, jedną z najpopularniejszych i zarazem posiadającą ogromne możliwości biblioteką do wizualizacji danych w języku R, jest ggplot2. Konia z rzędem temu kto zna wszystkie jej polecenia i potrafi wygenerować dowolny wykres „z marszu”. Jeśli nie należysz do grona szczęśliwców posiadających fotograficzną pamięć, to możesz skorzystać ze ściągawki przygotowanej przez twórców środowiska RStudio. Plik .pdf w dobrej jakości, w sam raz do wydrukowania i powieszenia nad biurkiem. Must have każdego analityka danych.