Uczenie Maszynowe

Wykład prowadzi Prof. Jerzy Stefanowski. Wszelkie sugestie do przedmiotu i poszczególnych zajęć możesz zgłaszać tutaj.

Tematyka zajęć

Ankieta wstępna i przygotowanie się na za tydzień: przestrzenie wersji, patrz punkt 1
Przestrzenie wersji
Indukcja drzew decyzyjnych metodami ID3, C4, C4.5 – obliczenia
Generowanie drzew decyzyjnych
Generowanie reguł decyzyjnych , termin (3. i 4.): 14.IV
Podstawy Weki i wybór danych do studium przypadku ze wskazaniem atrybutu decyzyjnego i warunkowych: [1], [2], [3], [4], inne własne
Klasyfikatory Bayes'owskie
Klasyfikatory k-NN i IBL
Przestrzeń atrybutów i jej transformacje
Uczenie nadzorowane sztucznych sieci neuronowych , termin: 5.V (nie trzeba wysyłać)
Uczenie nadzorowane sztucznych sieci neuronowych – zagadnienia zaawansowane , termin: 12.V
Topologie rekurencyjne; ewolucyjne dostrajanie topologii i wag; sztuczne sieci neuronowe czasu rzeczywistego
Uczenie nienadzorowane sztucznych sieci neuronowych
Metoda wektorów nośnych (Support Vector Machines, SVM) , termin: 19/20.V, moodle
Analiza dwuklasowego niezbalansowanego zbioru poznanymi metodami , termin: 2.VI, moodle
Klasyfikatory złożone , termin: 9.VI, moodle
Studium przypadku – analiza wybranego zbioru danych , termin: 17.VI
Studium ma mieć postać raportu (pdf) z wynikami (wartości, tabele, wykresy...) i wnioskami z nich płynącymi. Zakres analizy musi być oryginalny, tzn. nie może pokrywać się z innymi pracami znanymi autorowi dotyczącymi wybranego zbioru. Nie trzeba zamieszczać w raporcie fragmentów kodu, ale trzeba dokładnie napisać jakich narzędzi/pakietów/źródeł używano, i oczywiście szczegółowo jakich algorytmów i parametrów.
Co najmniej trzy algorytmy uczenia maszynowego na osobę. Jeśli więcej niż jedna osoba analizuje ten sam zbiór danych, każda osoba niezależnie i samodzielnie wykorzystuje co najmniej trzy metody analizy – inne, niż wybrały pozostałe osoby.
- Szczegółowy opis wybranego zbioru danych i jego charakterystyki; przykłady przypadków ze zbioru danych i interpretacja atrybutów.
- Cel: wykrycie w zbiorze danych wszystkich ciekawych zależności i własności. W tym celu samodzielny wybór technik wedle nabytej wiedzy dotyczącej uczenia maszynowego.
- Interpretacja (na ile jest możliwa) wyindukowanej przez algorytmy wiedzy.

W okolicach zajęć oznaczonych przeprowadzony będzie krótki sprawdzian/kartkówka z zakresu wcześniejszych laboratoriów i wykładów.

Sprawozdania

Do zaliczenia ćwiczeń oznaczonych niezbędne jest przygotowanie sprawozdania.
Sprawozdania proszę przygotowywać w grupach jedno- lub dwuosobowych.
Sprawozdania: pdf, polecam LaTeX/LyX i matplotlib [szablon]. Po jednym punkcie na każde zadanie.
Przy ocenianiu sprawozdań premiowana jest
- trafność i poprawność spostrzeżeń i wniosków,
- odpowiednia prezentacja wyników (wykresy, tabele),
- umiejętność wykorzystania terminologii uczenia maszynowego,
- zwięzłość,
- estetyka.
Opóźnienie w oddaniu sprawozdania obniza jego ocenę (ocena−=1 za każdy rozpoczęty tydzień).
Przed wysłaniem sprawozdania upewnij się, że:
- Podałeś pochodzenie źródłowe wszystkich cytowanych w sprawozdaniu fragmentów i wykorzystanych materiałów (literatura)
- Sprawdziłeś piswnię tekstu (spell-check)
- Wykresy (i w miarę możliwości rysunki) są wektorowe (pdf, ps, svg itp.)
- Zatytułowałeś mail tak: [UM] sprawozdanie 1, Janek Kowalski & Marcin Nowak

Zaliczenie

Podstawą wystawienia oceny zaliczającej zajęcia laboratoryjne jest średnia z ocen za sprawozdania i ocen z kartkówek, które trzeba wszystkie zaliczyć. Jedna nieobecność nieusprawiedliwiona nie wpływa na ocenę końcową, ale każda kolejna nieusprawiedliwiona obniża ocenę o 0,5.