Dwie alternatywy dla listy top-n elementów w systemie rekomendacyjnym

Większość systemów rekomendacyjnych korzysta z metody przedstawiania wyników rekomendacji w postaci listy n najlepszych (ang. Top-n) elementów. Czy zawsze jest ona optymalna? Czy wiesz jakie niesie ze sobą zagrożenia i jakie są dla niej alternatywy? Zapraszam do przeczytania wpisu 🙂

Dowiedz się więcej

Silnik rekomendacji filmów

Bardzo popularny temat w środowisku data science: wyznaczanie rekomendacji. Jeśli mowa o rekomendacjach to wybór zbioru danych nie może być inny niż zbiór filmów i ich atrybutów. Klasyka Data Miningu 🙂 Jeśli chcesz zobaczyć proces implementacji zbiorów rozmytych w silniku rekomendacji, to zapraszam do zapoznania się z treścią wpisu.

Dowiedz się więcej

Ściągawka z biblioteki ggplot2

Bez wątpienia, jedną z najpopularniejszych i zarazem posiadającą ogromne możliwości biblioteką do wizualizacji danych w języku R, jest ggplot2. Konia z rzędem temu kto zna wszystkie jej polecenia i potrafi wygenerować dowolny wykres „z marszu”. Jeśli nie należysz do grona szczęśliwców posiadających fotograficzną pamięć, to możesz skorzystać ze ściągawki przygotowanej przez twórców środowiska RStudio. Plik .pdf w dobrej jakości, w sam raz do wydrukowania i powieszenia nad biurkiem. Must have każdego analityka danych.

Dowiedz się więcej

Relacja z październikowego Warsaw Data Science Meetup

W ubiegłym tygodniu miałem okazje wziąć udział w pierwszym po wakacjach spotkaniu „Data Science Warsaw„. Było to moje pierwsze spotkanie z tą grupą i będąc szczerym muszę przyznać, że byłem pozytywnie zaskoczony zarówno atmosferą panują na spotkaniu, jak i poziomem prezentacji.

Dla tych którzy nie wiedzą, Data Science Warsaw jest spotkaniem organizowanym przez Dominika Batorskiego, skupiającym osoby pasjonujące się Machine Learning, Data Mining i wszystkim co związane z szeroko pojętym Data Science. Spotkanie ma charakter otwarty i przyjść na nie może dosłownie każdy. Kto jednak rzeczywiście chodzi na warszawskie meetup’y Data Science, starał się odkryć pierwszy z prelegentów 🙂

Dowiedz się więcej

Zbiory rozmyte – wstęp

Zanim przejdę do praktycznego zastosowania logiki rozmytej w Machine Learning’u, bądź silnikach rekomendacyjnych, czuję się zobowiązany do popełnienia krótkiego, teoretycznego wstępu, tak by każdy z czytających mógł zapoznać się z główną ideą zbiorów rozmytych. Pierwszy projekt który opublikuje na blogu będzie pisany „od zera”. W realnym projekcie, nie korzystając z żadnych gotowych bibliotek, zaimplementuję ideę zbiorów rozmytych w połączeniu z jednym z podejść stosowanych w silnikach rekomendacyjnych (Content-based filtering). Wszak łatwiej implementować coś co się dogłębnie rozumie. A więc zaczynamy…

Dowiedz się więcej

Zastosowanie metod wspomagających podejmowanie decyzji

Kontynuując temat rozpoczęty w poprzednim artykule, chciałbym dziś omówić kilka potencjalnych zastosowań omówionych metod wspomagających podejmowanie decyzji. Ze względu na swoją charakterystykę logika rozmyta wydaje się być odpowiednią do wdrażania w wielu dziedzinach naszego życia, w których mamy do czynienia z niepewnością, brakiem informacji bądź brakiem precyzji. Techniki bazujące na logice rozmytej mają szerokie zastosowanie … Dowiedz się więcej

Podejmowanie decyzji w warunkach niepewności

Istnieje kilka podstawowych metod podejmowania decyzji przy niepełnej bądź też niepewnej informacji. Specjalizowanie się w chociażby kilku z nich graniczy z cudem, dlatego też w ramach tego bloga będę skupiać się trzech podstawowych, które to są mi najbliższe :

  • zbiorach rozmytych,
  • zbiorach przybliżonych,
  • niepełnej informacji liniowej.

Co ciekawe, każda z nich ma w sobie odrobinę polskości, o czym wspominam poniżej. Każda z nich posiada swoje wady i zalety i może być stosowania w przypadku różnych potencjalnych sytuacji obarczonych niepewnością. Dla różnych typów zadań metody te będą dawały różne wyniki, dlatego też niezwykle ważny jest odpowiedni dobór metody do określonego problemu.

Dowiedz się więcej

Czym jest Data Science?

Tytuł postu i fundamentalne pytanie. Blog o danych, a więc wypada zacząć od podstaw. W Polskiej części internetu nie mogłem znaleźć żadnej definicji, piszę więc swoją. Najprostsza i najkrótsza może się sprowadzać do prostego tłumaczenia: Data Science to jest po prostu nauka o danych. Rodzi ona jednak kolejne pytania: o jakie dane właściwie chodzi, jak mają się one do Big Data i w końcu czym ta nauka o danych różni się od np. statystyki.

Dowiedz się więcej