Zaawansowana eksploracja danych  - Adavanced Data Mining

Przedmiot dla studentów Informatyki, specjalności TPD (Politechnika Poznanska).

Strona zawiera podstawowe materialy dydaktyczne - aby otrzymać więcej materiałów (także kserokopii  klasycznych slajdów na foliach) proszę skontaktować bezpośrednio z prowadzącym.

Prowadzący / Lecturer:

dr hab. inż. Jerzy Stefanowski , prof. nadzw.

Zaklada sie wcześniejsze zaliczeni pierwszej części przedmiotu Eksploracja danych (prow. prof. T. Morzy) 1 sem.specjalnosci TPD.

Aktualne wykłady -czwartek 15.10-16.40 sala CW 6 - edycja 2010/11

  1. Wprowadzenie do eksploracji danych i odkrywania wiedzy w bazach danych.
  2. Metody predykcji z wykorzystaniem regresji cz 1.
  3. Regresja wielokrotna, nieliniowa i selekcja zmiennych ( cz 2), inne modele predykcji.
  4. Wstępne przetwarzanie danych cz. 1. // dodatkowe kopie slajdow tradycyjnych u prowadzacego.
  5. Metody przetwarzanie wstepnego - cz2 - slajdy prezentacyjne z 2010
  6. Metody oceny wiedzy klasyfikacyjnej odkrytej z danych
  7. Przyklad procesu eksploracji rzeczywistych danych o klasyfikacji obiektów: Analiza stanu technicznego pojazdow.
  8. Metody oceny wynikow grupowania danych // kopie slajdow tradycyjnych u prowadzacego.
    Wykłady dodatkowe w zaleznosci od zaintersowania danego rocznika studentow:
    1. Metody odkrywania regul z danych. - Discovery of Rules from Data (lecture partly in Polish and English).
    2. Uwagi o wykorzystaniu sztucznych sieci neuronowych
    3. Metody konstruowania klasyfikatorów zlozonych // czesc slajdow z wykladu  Multiple Classifiers - Review of Basic Methods (mainly in English)..
    4. Konstruowanie klasyfikatorow z niezrownowazonych liczebnie klas decyzyjnych - nowy wyklad 2010 oraz slady tutorialu dla projektu ALGODEC (Handling imbalanced data: improving classifiers by selective pre-processing of examples)
    5. Zaawansowane algorytmy analizy skupień (Advanced Clustering Methods for Data Mining).
  9. Analiza szeregow czasowych (Time Series - Decomposition and Prediction)  dodatkowe materialy z sem. 2010/11  ; pozostale kopie slajdow tradycyjnych u prowadzacego.
  10. Poszukiwanie wzorcow sekwencyjnych (Mining Sequence Patterns) // czesciowe slajdy - reszta u prowadzacego.
  11. Eksploracja strumieni danych (Mining Data Streams: review of techniques and applications)
  12. Budowa klasyfikatorów dla zmiennych środowisk (ang.Adapting to Concept Drift).
  13. Uczenie sie z czesciowo etykietowanych danych (Active Learning from Partly Labeled Data: Query by Committee Methods) - wykład po angielsku
  14. Wizualizacja danych w odkrywaniu wiedzy.
  15. Inteligencja biznesowa i zastosowania komercyjne eksploracji zawartości baz danych (zestaw slajdow)

Inne moje dodatkowe wyklady zawierajace uzupelniajacy material:

  1. Tutorials on Data Mining - ALGODEC COST project
  2. Wyklady z przedmiotu uczenie maszynowe - warto dodatkowo sprawdzic (Analiza dyskryminacyjna,SVM,Sieci Neuronowe MLP, Kohonena,RBF).
  3. Wykład o szeregach czasowych prof. K.Krawca z PP

Materiały do ćwiczeń laboratoryjnych.

1. Ćwiczenie dotyczące badania współzależności zmiennych nominalnych w tablicach wielowymiarowych.
      Plik z danymi do tego ćwiczenia: (kwestionariuszowe do zad 3) ; (zoo zad 4) ; (stress-level zad 5).

2. Predykcja z wykorzystaniem regresji.
        Plik z danymi do tego ćwiczenia   (podstawy);   (platki);   (selekcja zmiennych - leki);   (regresja wielowymiarowa);     (regresja nieliniowa).

ćwiczenie dodatkowe. Indukcja drzew klasyfikacyjnych z danych  - cwicz-inddrzew.pdf

Materiały do dalszych ćwiczeń typu studium przypadku (z ang. case studies).

Wiecej informacji na wskazanej stronie

Literatura

Ostatnia aktualizacja: 5 01 2011 - J.Stefanowski