Uczenie Maszynowe

Wykład prowadzi Prof. Jerzy Stefanowski. Wszelkie sugestie do przedmiotu i poszczególnych zajęć możesz zgłaszać tutaj.

Tematyka zajęć

  1. Ankieta wstępna i przygotowanie się na za tydzień: przestrzenie wersji, patrz punkt 1
  2. Przestrzenie wersji
  3. Indukcja drzew decyzyjnych metodami ID3, C4, C4.5 – obliczenia
  4. Generowanie drzew decyzyjnych
  5. Generowanie reguł decyzyjnych   , termin (3. i 4.): 14.IV
  6. Podstawy Weki i wybór danych do studium przypadku ze wskazaniem atrybutu decyzyjnego i warunkowych: [1], [2], [3], [4], inne własne
  7. Klasyfikatory Bayes'owskie
  8. Klasyfikatory k-NN i IBL
  9. Przestrzeń atrybutów i jej transformacje
  10. Uczenie nadzorowane sztucznych sieci neuronowych   , termin: 5.V (nie trzeba wysyłać)
  11. Uczenie nadzorowane sztucznych sieci neuronowych – zagadnienia zaawansowane   , termin: 12.V
  12. Topologie rekurencyjne; ewolucyjne dostrajanie topologii i wag; sztuczne sieci neuronowe czasu rzeczywistego
  13. Uczenie nienadzorowane sztucznych sieci neuronowych
  14. Metoda wektorów nośnych (Support Vector Machines, SVM) , termin: 19/20.V, moodle
  15. Analiza dwuklasowego niezbalansowanego zbioru poznanymi metodami , termin: 2.VI, moodle
  16. Klasyfikatory złożone , termin: 9.VI, moodle
  17. Studium przypadku – analiza wybranego zbioru danych , termin: 17.VI
    Studium ma mieć postać raportu (pdf) z wynikami (wartości, tabele, wykresy...) i wnioskami z nich płynącymi. Zakres analizy musi być oryginalny, tzn. nie może pokrywać się z innymi pracami znanymi autorowi dotyczącymi wybranego zbioru. Nie trzeba zamieszczać w raporcie fragmentów kodu, ale trzeba dokładnie napisać jakich narzędzi/pakietów/źródeł używano, i oczywiście szczegółowo jakich algorytmów i parametrów.

    Co najmniej trzy algorytmy uczenia maszynowego na osobę. Jeśli więcej niż jedna osoba analizuje ten sam zbiór danych, każda osoba niezależnie i samodzielnie wykorzystuje co najmniej trzy metody analizy – inne, niż wybrały pozostałe osoby.

    • Szczegółowy opis wybranego zbioru danych i jego charakterystyki; przykłady przypadków ze zbioru danych i interpretacja atrybutów.
    • Cel: wykrycie w zbiorze danych wszystkich ciekawych zależności i własności. W tym celu samodzielny wybór technik wedle nabytej wiedzy dotyczącej uczenia maszynowego.
    • Interpretacja (na ile jest możliwa) wyindukowanej przez algorytmy wiedzy.

W okolicach zajęć oznaczonych przeprowadzony będzie krótki sprawdzian/kartkówka z zakresu wcześniejszych laboratoriów i wykładów.

Sprawozdania

  • Do zaliczenia ćwiczeń oznaczonych niezbędne jest przygotowanie sprawozdania.
  • Sprawozdania proszę przygotowywać w grupach jedno- lub dwuosobowych.
  • Sprawozdania: pdf, polecam LaTeX/LyX i matplotlib [szablon]. Po jednym punkcie na każde zadanie.
  • Przy ocenianiu sprawozdań premiowana jest
    • trafność i poprawność spostrzeżeń i wniosków,
    • odpowiednia prezentacja wyników (wykresy, tabele),
    • umiejętność wykorzystania terminologii uczenia maszynowego,
    • zwięzłość,
    • estetyka.
  • Opóźnienie w oddaniu sprawozdania obniza jego ocenę (ocena−=1 za każdy rozpoczęty tydzień).
  • Przed wysłaniem sprawozdania upewnij się, że:
    • Podałeś pochodzenie źródłowe wszystkich cytowanych w sprawozdaniu fragmentów i wykorzystanych materiałów (literatura)
    • Sprawdziłeś piswnię tekstu (spell-check)
    • Wykresy (i w miarę możliwości rysunki) są wektorowe (pdf, ps, svg itp.)
    • Zatytułowałeś mail tak:   [UM] sprawozdanie 1, Janek Kowalski & Marcin Nowak

Zaliczenie

Podstawą wystawienia oceny zaliczającej zajęcia laboratoryjne jest średnia z ocen za sprawozdania i ocen z kartkówek, które trzeba wszystkie zaliczyć. Jedna nieobecność nieusprawiedliwiona nie wpływa na ocenę końcową, ale każda kolejna nieusprawiedliwiona obniża ocenę o 0,5.