Analiza i eksploracja danych
Zagadnienia na egzamin
- Odkrywanie zbiorów częstych
- algorytm apriori, miara wsparcia
- znajomość reguł asocjacyjnych i naiwnego algorytmu ich konstrukcji, miara ufności
- wielowymiarowe reguły asocjacyjne, co to jest, algorytm odkrywania
- dyskretyzacja atrybutów ciągłych
- Klasyfikacja
- znajomość problemu klasyfikacji
- klasyfikator k-nn, obliczanie odległości pomiędzy obiektami o różnych rodzajach atrybutów
- klasyfikator ID3
- naiwny klasyfikator Bayesa
- ocena jakości klasyfikatorów: zbiór trenujący i testujący, macierz pomyłek, walidacja skrośna, miary precision i recall
- Grupowanie
- problem grupowania
- hierarchiczny aglomeracyjny algorytm grupowania + miary odległości
- algorytm k-means