Back
Wykłady: Jerzy Stefanowski
Projekt: YouTube trending videos
Opis projektu
Zbiór danych na kaggle (do podglądu - w ramach projektu korzystamy ze zmodyfikowanego zbioru!)
Dane GB
Dane US
Harmonogram
- (02.03) Wprowadzenie do projektu // wykład: Odkrywanie wiedzy [pdf]
- (09.03) Konsultacje // wykład: Przetwarzanie wstępne i selekcja cech [pdf]
- (16.03) Checkpoint 1A: Atrybuty tekstowe // wykład: Dyskretyzacja atrybutów liczbowych [pdf]
- (23.03) Checkpoint 1B: Atrybuty tekstowe // wykład: Wprowadzenie do eksploracji niezbalansowanych danych cz.1 [pdf]
- (30.03) Checkpoint 2A: Atrybuty wizualne // wykład: Zaawansowana eksploracja niezbalansowanych danych - cz2 [pdf] // multi-imbalance package for python
- (06.04) Checkpoint 2B: Atrybuty wizualne // wykład: Uczenie cześciowo nadzorowane (SSL) - cz1 [pdf] oraz cz2 [pdf]
- (13.04) Checkpoint 3A: Ocena ważności atrybutów i ich redukcja // wykład: SSL - cz3 [pdf] oraz Intepretacja modeli ML - cz1 [pdf] oraz cz2 [pdf]
- (20.04) Checkpoint 3B: Ocena ważności atrybutów i ich redukcja // wykład: Intepretacja modeli ML - cz3 [pdf]
- (27.04) Checkpoint 4A: Uczenie pół-nadzorowane // wykład: Analiza szeregów czasowych - cz1 [pdf]
- (04.05) Checkpoint 4B: Uczenie pół-nadzorowane // wykład: Analiza szeregów czasowych - cz2 [pdf]
- (11.05) Checkpoint 5A: YouTube API // wykład: Strumienie danych - cz1 [pdf] oraz cz2 [pdf]
- (18.05) Checkpoint 5B: YouTube API // wykład: Strumienie danych - cz3 [pdf]
- (25.05) Konsultacje
- (01.06) Checkpoint 6A: Klasyfikator i wiedza dla klienta
- (08.06) Checkpoint 6B: Klasyfikator i wiedza dla klienta
- (15.06) Kolokwium / Zaliczenie projektu (końcowy deadline)
Zasady zaliczenia
Zaliczenie odbywa się w oparciu o projekt YouTube trending videos. Projekty realizowane są w grupach dwu-osobowych, podział ustalany jest na zajęciach wprowadzających.
Grupy dzielone są na tygodnie A oraz B. Obecność na zajęciach wspólnych (pogrubione na harmonogramie) oraz na swoich punktach kontrolnych jest obowiązkowa. Dopuszczalne są dwie nieobecności w trakcie semestru, każda kolejna skutkuje obniżeniem oceny o pół stopnia. Ponad 30% nieobecności w trakcie semestru stanowi podstawę do niezaliczenia przedmiotu. Nieusprawiedliwiona nieobecność wszystkich członków grupy w ramach punktu kontrolnego skutkuje utraceniem punktów za ten punkt kontrolny.
Aby zaliczyć laboratoria na ocenę 3 należy otrzymać łącznie co najmniej 50% punktów, wykonując jednocześnie co najmniej cztery z sześciu etapów + końcowy raport. Każde kolejne 10% podnosi ocenę o pół stopnia. Za każdy etap można uzyskać maksymalnie 15% punktów, za raport końcowy dodatkowo 10%. Punkty za etap przyznawane są w ramach punktu kontrolnego (a nie na koniec).