Zaawansowana eksploracja danych - "Adavanced Data
Mining"
Przedmiot dla studentów Informatyki, specjalności TPD
(Politechnika Poznanska) - edycja do 2015 rok / pozniej dokonano zmian w prowadzeniu tego przedmiotu.
Strona zawiera podstawowe materialy dydaktyczne - aby otrzymać więcej
materiałów (także kserokopii klasycznych slajdów na foliach) proszę
skontaktować bezpośrednio z prowadzącym.
Prowadzący / Lecturer:
dr hab. inż. Jerzy Stefanowski , prof.
nadzw. oraz wspolpracownicy
Zaklada sie wcześniejsze zaliczeni pierwszej części przedmiotu Eksploracja
danych (prow. prof. T. Morzy) 1 sem.specjalnosci TPD.
Aktualne wykłady - środa 9.45-11.15 sala CW 6 - edycja 2013/14
- Wprowadzenie
do eksploracji danych i odkrywania wiedzy w bazach danych.
- Metody
predykcji z wykorzystaniem regresji cz 1.
- Regresja
wielokrotna, nieliniowa i selekcja zmiennych ( cz 2), inne modele
predykcji.
- Wstępne przetwarzanie danych cz. 1. // dodatkowe kopie slajdow tradycyjnych u
prowadzacego.
- Metody
przetwarzanie wstepnego - cz2 - slajdy prezentacyjne z 2010
- Metody
oceny wiedzy klasyfikacyjnej odkrytej z danych
- Przyklad procesu eksploracji rzeczywistych danych o klasyfikacji obiektów:
Analiza
stanu technicznego pojazdow.
- Metody oceny wynikow grupowania danych oraz
Wykłady dodatkowe w zaleznosci od zainteresowania danego
rocznika studentow:
- Metody
odkrywania regul z danych. - Discovery of Rules from Data (lecture
partly in Polish and English).
- Uwagi
o wykorzystaniu sztucznych sieci neuronowych
- Metody konstruowania klasyfikatorów zlozonych // czesc
slajdow z wykladu Multiple Classifiers - Review of Basic Methods
(mainly in English)..
- Konstruowanie klasyfikatorow z niezrownowazonych liczebnie klas
decyzyjnych - nowy wyklad 2010 oraz slady
tutorialu dla projektu ALGODEC (Handling imbalanced data: improving
classifiers by selective pre-processing of examples)
- Dwa wykłady nt. algorytmów analizy skupień - Parametryzacja i stosowanie k-means oraz AHC oraz
Ocena oraz inne
algorytmy analizy skupień .
- Analiza
szeregow czasowych (Time Series - Decomposition and Prediction) dodatkowe
materialy z sem. 2010/11
; pozostale kopie slajdow tradycyjnych u prowadzacego.
- Poszukiwanie
wzorcow sekwencyjnych (Mining Sequence Patterns) // czesciowe slajdy -
reszta u prowadzacego.
- Eksploracja
strumieni danych (Mining Data Streams: review of techniques and
applications)
- Budowa klasyfikatorów dla zmiennych środowisk (ang.Adapting to Concept
Drift).
- Uczenie
sie z czesciowo etykietowanych danych (Active Learning from Partly Labeled
Data: Query by Committee Methods) - wykład po angielsku
- Wizualizacja danych w odkrywaniu wiedzy.
- Inteligencja biznesowa i zastosowania komercyjne eksploracji zawartości
baz danych (zestaw
slajdow)
Inne moje dodatkowe wyklady zawierajace material uzupelniajac :
- Tutorials
on Data Mining - ALGODEC COST project
- Lectures
on Mining Imbalanced Data, Data Streams and Rule Classifiers - PAN Interdisciplinary PhD Studies
- Wyklady
z przedmiotu uczenie maszynowe - warto dodatkowo sprawdzic (Analiza
dyskryminacyjna,SVM,Sieci Neuronowe MLP, Kohonena,RBF).
- Wykład o szeregach czasowych prof. K.Krawca z PP
Materiały do ćwiczeń laboratoryjnych.
1. Ćwiczenie
dotyczące badania współzależności zmiennych nominalnych w tablicach
wielowymiarowych.
Plik z danymi do tego
ćwiczenia: (kwestionariuszowe
do zad 3) ; (zoo zad 4) ; (stress-level
zad 5).
2. Predykcja z
wykorzystaniem regresji.
Plik
z danymi do tego ćwiczenia (podstawy);
(platki);
(selekcja
zmiennych - leki); (regresja
wielowymiarowa); (regresja
nieliniowa).
ćwiczenie dodatkowe. Indukcja drzew
klasyfikacyjnych z danych - cwicz-inddrzew.pdf
Materiały do
dalszych ćwiczeń typu studium przypadku (z ang. case studies) - obecnie niedostepne
Wiecej informacji u prowadzacego
Literatura
- Eksploracja danych, Tadeusz Morzy, PWN, 2013 (Informacja na stronie PWN).
- Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber, Jian
Pei, Morgan Kaufmann, 2005 (2
rozszerzone wydanie).
- Odkrywanie wiedzy z danych, Larose D. ( polskie
tłumaczenie), PWN, Warszawa, 2006.
- Introduction to Data Mining, Pan-Ning Tan, Michael Steinbach, Vipin Kumar,
Addison Wesley 2006.
- Eksploracja danych, Hand D., Mannila H., Smyth P. (polskie tłumaczenie
WNT)
- The Data Mining and Knowledge Discovery Handbook. Oded Maimon, Lior Rokach
(red.) Springer 2005..
- Inne pozycje wg. informacji prowadzacego
Ostatnia aktualizacja: 15 11 2016 - J.Stefanowski