Analiza i eksploracja danych

Zagadnienia na egzamin
  • Odkrywanie zbiorów częstych
    • algorytm apriori, miara wsparcia
    • znajomość reguł asocjacyjnych i naiwnego algorytmu ich konstrukcji, miara ufności
    • wielowymiarowe reguły asocjacyjne, co to jest, algorytm odkrywania
    • dyskretyzacja atrybutów ciągłych
  • Klasyfikacja
    • znajomość problemu klasyfikacji
    • klasyfikator k-nn, obliczanie odległości pomiędzy obiektami o różnych rodzajach atrybutów
    • klasyfikator ID3
    • naiwny klasyfikator Bayesa
    • ocena jakości klasyfikatorów: zbiór trenujący i testujący, macierz pomyłek, walidacja skrośna, miary precision i recall
  • Grupowanie
    • problem grupowania
    • hierarchiczny aglomeracyjny algorytm grupowania + miary odległości
    • algorytm k-means