Zaawansowana eksploracja danych
Dariusz Brzeziński
Agenda
- Cel zajęć
- Zasady gry
- Wstępny plan
Odkrywanie wiedzy
- Selekcja danych
- Czyszczenie i wstępne przetwarzanie danych
- Przekształcenie i redukcja danych
- Wybór zadania/zadań eksploracji danych
- Eksploracja danych
- Interpretacja, analiza i ocena odkrytej wiedzy, wizualizacja
odkrytych wzorców
Cel zajęć
- Praca nad całym procesem odkrywania wiedzy
- Praktyczna eksploracja danych (R + Python)
- Omówienie najczęstszych problemów pojawiających się podczas analizy danych
- Przedstawienie kliku bardziej złożonych metod uczenia maszynowego
- Samodzielna praca z prawdziwymi danymi
- Nauka interpretacji uzyskanych wyników
- Tworzenie raportów i interaktywnych wizualizacji
Zasady gry
- Obecność
- Kartkówki (w tym roku raczej quizy)
- Raport z analizy danych (R + knitr)
- Raport z uczenia maszynowego (Python + Notebook)
- Dla chętnych dodatkowa aplikacja (R + shiny i/lub Python + Dash)
Wstępny plan
- Programowanie w R
- Czyszczenie i analiza danych
- Powtarzalne eksperymenty i raportowanie
- Interaktywna wizualizacja danych
- Regresja, klasyfikacja i grupowanie
- Bardziej zaawansowane metody uczenia maszynowego (analiza tekstu i sentymentu, topic modeling, word embeddings, uczenie głębokie)