Zaawansowana eksploracja danych  - "Adavanced Data Mining"

Przedmiot dla studentów Informatyki, specjalności TPD (Politechnika Poznanska) - edycja do 2015 rok / pozniej dokonano zmian w prowadzeniu tego przedmiotu.

Strona zawiera podstawowe materialy dydaktyczne - aby otrzymać więcej materiałów (także kserokopii  klasycznych slajdów na foliach) proszę skontaktować bezpośrednio z prowadzącym.

Prowadzący / Lecturer:

dr hab. inż. Jerzy Stefanowski , prof. nadzw.  oraz wspolpracownicy

Zaklada sie wcześniejsze zaliczeni pierwszej części przedmiotu Eksploracja danych (prow. prof. T. Morzy) 1 sem.specjalnosci TPD.

Aktualne wykłady - środa 9.45-11.15 sala CW 6 - edycja 2013/14

  1. Wprowadzenie do eksploracji danych i odkrywania wiedzy w bazach danych.
  2. Metody predykcji z wykorzystaniem regresji cz 1.
  3. Regresja wielokrotna, nieliniowa i selekcja zmiennych ( cz 2), inne modele predykcji.
  4. Wstępne przetwarzanie danych cz. 1. // dodatkowe kopie slajdow tradycyjnych u prowadzacego.
  5. Metody przetwarzanie wstepnego - cz2 - slajdy prezentacyjne z 2010
  6. Metody oceny wiedzy klasyfikacyjnej odkrytej z danych
  7. Przyklad procesu eksploracji rzeczywistych danych o klasyfikacji obiektów: Analiza stanu technicznego pojazdow.
  8. Metody oceny wynikow grupowania danych oraz
    Wykłady dodatkowe w zaleznosci od zainteresowania danego rocznika studentow:
    1. Metody odkrywania regul z danych. - Discovery of Rules from Data (lecture partly in Polish and English).
    2. Uwagi o wykorzystaniu sztucznych sieci neuronowych
    3. Metody konstruowania klasyfikatorów zlozonych // czesc slajdow z wykladu  Multiple Classifiers - Review of Basic Methods (mainly in English)..
    4. Konstruowanie klasyfikatorow z niezrownowazonych liczebnie klas decyzyjnych - nowy wyklad 2010 oraz slady tutorialu dla projektu ALGODEC (Handling imbalanced data: improving classifiers by selective pre-processing of examples)
    5. Dwa wykłady nt. algorytmów analizy skupień - Parametryzacja i stosowanie k-means oraz AHC oraz Ocena oraz inne algorytmy analizy skupień .
  9. Analiza szeregow czasowych (Time Series - Decomposition and Prediction)  dodatkowe materialy z sem. 2010/11  ; pozostale kopie slajdow tradycyjnych u prowadzacego.
  10. Poszukiwanie wzorcow sekwencyjnych (Mining Sequence Patterns) // czesciowe slajdy - reszta u prowadzacego.
  11. Eksploracja strumieni danych (Mining Data Streams: review of techniques and applications)
  12. Budowa klasyfikatorów dla zmiennych środowisk (ang.Adapting to Concept Drift).
  13. Uczenie sie z czesciowo etykietowanych danych (Active Learning from Partly Labeled Data: Query by Committee Methods) - wykład po angielsku
  14. Wizualizacja danych w odkrywaniu wiedzy.
  15. Inteligencja biznesowa i zastosowania komercyjne eksploracji zawartości baz danych (zestaw slajdow)

Inne moje dodatkowe wyklady zawierajace material uzupelniajac :

  1. Tutorials on Data Mining - ALGODEC COST project
  2. Lectures on Mining Imbalanced Data, Data Streams and Rule Classifiers - PAN Interdisciplinary PhD Studies
  3. Wyklady z przedmiotu uczenie maszynowe - warto dodatkowo sprawdzic (Analiza dyskryminacyjna,SVM,Sieci Neuronowe MLP, Kohonena,RBF).
  4. Wykład o szeregach czasowych prof. K.Krawca z PP

Materiały do ćwiczeń laboratoryjnych.

1. Ćwiczenie dotyczące badania współzależności zmiennych nominalnych w tablicach wielowymiarowych.
      Plik z danymi do tego ćwiczenia: (kwestionariuszowe do zad 3) ; (zoo zad 4) ; (stress-level zad 5).

2. Predykcja z wykorzystaniem regresji.
        Plik z danymi do tego ćwiczenia   (podstawy);   (platki);   (selekcja zmiennych - leki);   (regresja wielowymiarowa);     (regresja nieliniowa).

ćwiczenie dodatkowe. Indukcja drzew klasyfikacyjnych z danych  - cwicz-inddrzew.pdf

Materiały do dalszych ćwiczeń typu studium przypadku (z ang. case studies) - obecnie niedostepne

Wiecej informacji u prowadzacego

Literatura

Ostatnia aktualizacja: 15 11 2016 - J.Stefanowski