Back


Wykłady: Jerzy Stefanowski

Projekt: YouTube trending videos

Opis projektu

Zbiór danych na kaggle (do podglądu - w ramach projektu korzystamy ze zmodyfikowanego zbioru!)

Dane GB

Dane US

Harmonogram

 1. (02.03) Wprowadzenie do projektu // wykład: Odkrywanie wiedzy [pdf]
 2. (09.03) Konsultacje // wykład: Przetwarzanie wstępne i selekcja cech [pdf]
 3. (16.03) Checkpoint 1A: Atrybuty tekstowe // wykład: Dyskretyzacja atrybutów liczbowych [pdf]
 4. (23.03) Checkpoint 1B: Atrybuty tekstowe // wykład: Wprowadzenie do eksploracji niezbalansowanych danych cz.1 [pdf]
 5. (30.03) Checkpoint 2A: Atrybuty wizualne // wykład: Zaawansowana eksploracja niezbalansowanych danych - cz2 [pdf] // multi-imbalance package for python
 6. (06.04) Checkpoint 2B: Atrybuty wizualne // wykład: Uczenie cześciowo nadzorowane (SSL) - cz1 [pdf] oraz cz2 [pdf]
 7. (13.04) Checkpoint 3A: Ocena ważności atrybutów i ich redukcja // wykład: SSL - cz3 [pdf] oraz Intepretacja modeli ML - cz1 [pdf] oraz cz2 [pdf]
 8. (20.04) Checkpoint 3B: Ocena ważności atrybutów i ich redukcja // wykład: Intepretacja modeli ML - cz3 [pdf]
 9. (27.04) Checkpoint 4A: Uczenie pół-nadzorowane // wykład: Analiza szeregów czasowych - cz1 [pdf]
 10. (04.05) Checkpoint 4B: Uczenie pół-nadzorowane // wykład: Analiza szeregów czasowych - cz2 [pdf]
 11. (11.05) Checkpoint 5A: YouTube API // wykład: Strumienie danych - cz1 [pdf] oraz cz2 [pdf]
 12. (18.05) Checkpoint 5B: YouTube API // wykład: Strumienie danych - cz3 [pdf]
 13. (25.05) Konsultacje
 14. (01.06) Checkpoint 6A: Klasyfikator i wiedza dla klienta
 15. (08.06) Checkpoint 6B: Klasyfikator i wiedza dla klienta
 16. (15.06) Kolokwium / Zaliczenie projektu (końcowy deadline)

Zasady zaliczenia

 Zaliczenie odbywa się w oparciu o projekt YouTube trending videos. Projekty realizowane są w grupach dwu-osobowych, podział ustalany jest na zajęciach wprowadzających.

 Grupy dzielone są na tygodnie A oraz B. Obecność na zajęciach wspólnych (pogrubione na harmonogramie) oraz na swoich punktach kontrolnych jest obowiązkowa. Dopuszczalne są dwie nieobecności w trakcie semestru, każda kolejna skutkuje obniżeniem oceny o pół stopnia. Ponad 30% nieobecności w trakcie semestru stanowi podstawę do niezaliczenia przedmiotu. Nieusprawiedliwiona nieobecność wszystkich członków grupy w ramach punktu kontrolnego skutkuje utraceniem punktów za ten punkt kontrolny.

 Aby zaliczyć laboratoria na ocenę 3 należy otrzymać łącznie co najmniej 50% punktów, wykonując jednocześnie co najmniej cztery z sześciu etapów + końcowy raport. Każde kolejne 10% podnosi ocenę o pół stopnia. Za każdy etap można uzyskać maksymalnie 15% punktów, za raport końcowy dodatkowo 10%. Punkty za etap przyznawane są w ramach punktu kontrolnego (a nie na koniec).