Statystyka i Analiza Danych (SiAD)

Grupy

poniedziałek: 8:00, 9:45; czwartek: 8:00, 13:30

Oceny z wyjściówek

Konsultacje

czwartek, 9:45-13:15

Materiały do zajęć

Wszystkie materiały potrzebne podczas laboratorium znajdują się w repozytorium WebDAV przedmiotu.

Slajdy pokazywane podczas laboratorium znajdują się tu.

Polecam stronę kolegi Mateusza Lango, na której znajduje się wiele dodatkowych materiałów.

Zadania domowe z R znajdują się na platformie DataCamp.

Opis instalacji Jupyter notebook z jądrem języka R - może przydać się jeśli chcecie rozwiązywać zadania laboratoryjne na własnym komputerze. Być może przydadzą się również dodatkowe informacje o tym jak poradzić sobie z instalacją na systemie Windows.

Zadanie domowe 1

Zadanie domowe poświęcone jest testowaniu hipotez i obejmuje następujące elementy:

  1. wybór zbioru danych do analizy -- można skorzystać z jednego z podanych poniżej źródeł danych, z innych źródeł (Google na pewno chętnie coś podpowie), albo też wygenerować dane samodzielnie (np. wykonując odpowiedni eksperyment obliczeniowy)
  2. wykonanie podstawowej analizy eksploracyjnej, tzn. przygotowanie szeregu rozdzielczego i histogramu (proszę zwrócić uwagę na sensowny dobór liczby klas) i wyznaczenie wartości podstawowych statystyk opisowych -- tutaj należy krótko uzasadnić wybór statystyki oraz skomentować uzyskany wynik,
  3. postawienie co najmniej jednej hipotezy dotyczącej danych i przetestowanie jej. W przypadku, gdy zbiór danych dotyczy całej populacji (np. dane z GUS), do testów należy wybrać podzbiór danych oraz skomentować, czy popełniono błąd I lub II rodzaju.

Zadanie domowe można wykonać korzystając z R-a lub arkusza kalkulacyjnego, natomiast sprawozdanie powinno mieć formę tradycyjnego dokumentu (w formacie PDF) lub notebooka R. Powinno ono zawierać następujące elementy:

  1. imię, nazwisko i grupę (dzień, godzina) autora,
  2. opis zbioru danych -- skąd pochodzi, czego dotyczy, cz są to dane obserwacyjne, czy też eksperymentalne,
  3. wynik analizy eksploracyjnej -- wykresy i wartości statystyk opisowych wraz z krótkimi komentarzami,
  4. wynik testowania hipotez -- sformułowanie hipotezy, wybór testu i weryfikacja jego wymagań, opis i wynik procesu wnioskowania,
  5. ewentualne komentarze i spostrzeżenia dotyczące danych i wyników analizy.

Obserwacje i komentarze mogą być w formie punktowej (nie musi być to proza). Termin nadsyłania sprawozdań to czwartek, 31 maja (spóźnienie będzie wiązało się z obniżeniem oceny - 10% za każdy dzień). Do najbliższego czwartku (24 maja) proszę o informację, jakie zbiory danych będziecie wykorzystywali.

Organizacja zajęć i zasady zaliczenia

Karta ECTS przedmiotu.