Uczenie Maszynowe
Wykład prowadzi Prof. Jerzy Stefanowski. Wszelkie sugestie do przedmiotu i poszczególnych zajęć możesz zgłaszać tutaj.
Tematyka zajęć
- Ankieta wstępna i przygotowanie się na za tydzień: przestrzenie wersji, patrz punkt 1
- Przestrzenie wersji
- Indukcja drzew decyzyjnych metodami ID3, C4, C4.5 – obliczenia
- Generowanie drzew decyzyjnych
- Generowanie reguł decyzyjnych , termin (3. i 4.): 14.IV
- Podstawy Weki i wybór danych do studium przypadku ze wskazaniem atrybutu decyzyjnego i warunkowych: [1], [2], [3], [4], inne własne
- Klasyfikatory Bayes'owskie
- Klasyfikatory k-NN i IBL
- Przestrzeń atrybutów i jej transformacje
- Uczenie nadzorowane sztucznych sieci neuronowych , termin: 5.V (nie trzeba wysyłać)
- Uczenie nadzorowane sztucznych sieci neuronowych – zagadnienia zaawansowane , termin: 12.V
- Topologie rekurencyjne; ewolucyjne dostrajanie topologii i wag; sztuczne sieci neuronowe czasu rzeczywistego
- Uczenie nienadzorowane sztucznych sieci neuronowych
- Metoda wektorów nośnych (Support Vector Machines, SVM) , termin: 19/20.V, moodle
- Analiza dwuklasowego niezbalansowanego zbioru poznanymi metodami , termin: 2.VI, moodle
- Klasyfikatory złożone , termin: 9.VI, moodle
- Studium przypadku – analiza wybranego zbioru danych , termin: 17.VI
Studium ma mieć postać raportu (pdf) z wynikami (wartości, tabele, wykresy...) i wnioskami z nich płynącymi. Zakres analizy musi być oryginalny, tzn. nie może pokrywać się z innymi pracami znanymi autorowi dotyczącymi wybranego zbioru. Nie trzeba zamieszczać w raporcie fragmentów kodu, ale trzeba dokładnie napisać jakich narzędzi/pakietów/źródeł używano, i oczywiście szczegółowo jakich algorytmów i parametrów.Co najmniej trzy algorytmy uczenia maszynowego na osobę. Jeśli więcej niż jedna osoba analizuje ten sam zbiór danych, każda osoba niezależnie i samodzielnie wykorzystuje co najmniej trzy metody analizy – inne, niż wybrały pozostałe osoby.
- Szczegółowy opis wybranego zbioru danych i jego charakterystyki; przykłady przypadków ze zbioru danych i interpretacja atrybutów.
- Cel: wykrycie w zbiorze danych wszystkich ciekawych zależności i własności. W tym celu samodzielny wybór technik wedle nabytej wiedzy dotyczącej uczenia maszynowego.
- Interpretacja (na ile jest możliwa) wyindukowanej przez algorytmy wiedzy.
W okolicach zajęć oznaczonych przeprowadzony będzie krótki sprawdzian/kartkówka z zakresu wcześniejszych laboratoriów i wykładów.
Sprawozdania
- Do zaliczenia ćwiczeń oznaczonych niezbędne jest przygotowanie sprawozdania.
- Sprawozdania proszę przygotowywać w grupach jedno- lub dwuosobowych.
- Sprawozdania: pdf, polecam LaTeX/LyX i matplotlib [szablon]. Po jednym punkcie na każde zadanie.
- Przy ocenianiu sprawozdań premiowana jest
- trafność i poprawność spostrzeżeń i wniosków,
- odpowiednia prezentacja wyników (wykresy, tabele),
- umiejętność wykorzystania terminologii uczenia maszynowego,
- zwięzłość,
- estetyka.
- Opóźnienie w oddaniu sprawozdania obniza jego ocenę (ocena−=1 za każdy rozpoczęty tydzień).
- Przed wysłaniem sprawozdania upewnij się, że:
- Podałeś pochodzenie źródłowe wszystkich cytowanych w sprawozdaniu fragmentów i wykorzystanych materiałów (literatura)
- Sprawdziłeś piswnię tekstu (spell-check)
- Wykresy (i w miarę możliwości rysunki) są wektorowe (pdf, ps, svg itp.)
- Zatytułowałeś mail tak:
[UM] sprawozdanie 1, Janek Kowalski & Marcin Nowak
Zaliczenie
Podstawą wystawienia oceny zaliczającej zajęcia laboratoryjne jest średnia z ocen za sprawozdania i ocen z kartkówek, które trzeba wszystkie zaliczyć. Jedna nieobecność nieusprawiedliwiona nie wpływa na ocenę końcową, ale każda kolejna nieusprawiedliwiona obniża ocenę o 0,5.