Eksploracja Masywnych Danych (Zaawansowana Eksploracja Danych)

Dariusz Brzeziński

Wprowadzenie

Próbka

Prosty wykres z linią trendu

Próbka

Trochę ciekawszy wykres

Próbka

Wielowymiarowa wizualizacja

Zasady gry

  • Metoda zaliczenia do wyboru:
    1. 2 projekty:
      • Raport z analizy danych (R + knitr)
      • Raport z uczenia maszynowego (Python + Notebook).
    2. Co najmniej 9/11 zadań z poszczególnych laboratoriów
    3. Metoda mieszana - projekt z R oraz 5/6 zadań z lab dot. pythona lub projekt z pythona i 4/5 zadań z lab dot. R

Zasady gry c.d.

  • Ocena końcowa - średnia z ocen za 2 projekty lub 9 zadań (w przypadku metody mieszanej - waga oceny za projekt = suma wag za zadania lab)
  • Zadania/projekty realizowane w parach
  • Termin przesłania zadania z danego lab podany przy temacie
  • Terminy przesłania projektów podany wraz z projektami

Wstępny plan

  • Programowanie w R
  • Czyszczenie i analiza danych
  • Powtarzalne eksperymenty i raportowanie
  • Interaktywna wizualizacja danych
  • Regresja, klasyfikacja i grupowanie
  • Bardziej zaawansowane metody uczenia maszynowego (analiza tekstu i sentymentu, topic modeling, word embeddings, uczenie głębokie)