Postanowiłem zrobić mały eksperyment i porównać działanie dwóch algorytmów na tym samym zbiorze. Czy k-średnich poradzi sobie lepiej ze zmiennymi ciągłymi, niz k-modes z kategoryzowanymi zmiennymi ciągłymi?
k-modes
K-prototypów – grupowanie zmiennych kategorycznych i ciągłych
Ostatni, najbardziej zaawansowany z algorytmów iteracyjno-optymalizacyjnych, który opisuję na blogu. K-prototypów, bo o nim mowa pozwala na grupowanie mieszanego zbioru składającego się ze zmiennych kategorycznych i ciągłych.
K-modes – grupowanie zmiennych kategorycznych
Gdy zbiór zawiera zmienne numeryczne mamy do wyboru całą gamę algorytmów grupujących. Całość się nieco komplikuje, gdy w grę wchodzą zmienne kategoryczne. W tej sytuacji rozwiązaniem może być algorytm k-modes.