Statistical Data Analysis


Statystyka i Analiza Danych dla studentów niestacjonarnych

Laboratorium 3

Zagadnienia Studenci zapoznawszy się z mechanizmami wnioskowania statystycznego opartymi na statystykach Z i T, rozpoczynają modelowanie zmiennych zależnych poprzez analizę regresji. Podczas zajęć przypominane jest pojęcie korelacji i kowariancji, omawiane śa zasady interpretacji powyższych miar oraz wprowadza się test t dla wspołczynnika korelacji. Następnie, studenci poznają zasadę minimalizowania sumy kwadratów odchyleń dla regresji liniowej oraz zapoznają się z metodami weryfikacji modelu regresji (współczynnik determinacji, test F, wykresy diagnostyczne). Analiza zależności zmiennych jakościowych (testy chi2) pozostawione są do samodzielnego opanowana przez studenta.

Informacja o zaliczeniu: zaliczenie ma formę testu z pytaniami otwartymi i zamkniętymi (wielokrotnego wyboru). Zadania dotyczą zarówno zagadanień teoretycznych jak i praktycznych, wyszczególnionych w wykazach zagadnień dla wszystkich laboratoriów. Podczas zaliczenia student może korzystać z interpretera języka R (w szczególności można korzystać z pomocy) oraz tablic statystycznych, które będą dostarczone przez prowadzącego. Nie jest możliwe korzystanie z kart wzorów, kalkulatorów (jest R!), a komputery będą odłączone od Internetu. Niektóre zadania będą miały charakter praktyczny i będą wymagały przeprowadzenia obliczeń na danych uprzednio wczytanych do przestrzeni roboczej języka R. Wyniki obliczeń będzie należało przepisać na kartę sprawdzianu oraz je zinterpretować. Sama zawartość notebooka w R (kod) nie będzie podlegała ocenie.

Materiały:

Zadanie domowe (nieobowiązkowe)

Laboratorium 2

Zagadnienia Studenci, po zapoznaniu się z podstawami statystyki opisowej oraz modelowania probabilistycznego, przechodzą do wnioskowania statystycznego opartego na testach istotności. Zapoznają się z ideą testowania statystycznego: stawianie hipotez, p-wartość, zbiór krytyczny, interpretacja wyników testu. Poznają dwie wersje testu Walda: test dla średniej i sumy przy znanej σ w rozkładzie normalnym oraz test w rozkładzie dwupunktowym (przy spełnionych warunkach CLT). Studenci poznają rozkład t i jego relację do rozkładu normalnego, uczą się rozpoznawania sytuacji w których należy stosować ten rozkład zamiast rozkładu normalnego. Omawiany jest test t-Studenta dla jednej populacji, a następnie wskazuje się na relację między testem statystycznym a przedziałem ufności, różnicę między istotnością statystyczną a praktyczną, a także na wpływ rozmiaru próbki na osiągane rezultaty. Definiowane są błędy I i II rodzaju, a także przeprowadza się uproszczoną analizę mocy testu. Ćwiczy się także podstawowe testy 2 populacji, jednak większość z nich musi zostać samodzielnie opanowana przez studenta w oparciu o wiedzę o testach pojedynczej populacji.

Materiały:

Zadanie domowe (nieobowiązkowe)

Laboratorium 1

Zagadnienia Na laboratoriach studenci zaznajamiają się z podstawowymi pojęciami statystyki, zaczynają rozumieć wyzwania i szanse rodzące się ze zjawiska zwanego "erą dużych danych". Dodatkowo prezentowane są liczne zastosowania analizy danych w naukach IT (i nie tylko). Po zajęciach student powinien być w stanie rozpoznać różne rodzaje atrybutów statystycznych, rozróżnić dane pochodzące z eksperymentu i obserwacji oraz rozumieć podstawowe możliwości i ograniczenia wyciągania z takich danych wniosków. Student pozna podstawowe zasady konstruowania próbki, a także podstawy statystyka opisowej. W szczególności podawane są definicje i praktyczne przykłady zastosowania średniej arytmetycznej, mediany, mody, wariancji, odchylenie standardowego, IQR, kurtoza, skośność, rozstęp... Wykonywane ćwiczenia kładą nacisk na umiejętność analizy i interpretacji powyższych miar. Na laboratoriach przypominane są też podstawowe własności prawdopodobieństwa poznane przez studentów na Metodach Probabilistycznych, szczególny nacisk kładziony jest na Centralne Twierdzenie Graniczne. Na laboratorium prezentowana jest także karta ECTS przedmiotu oraz przedstawiane są zasady zaliczenia przedmiotu.

Materiały:

Zadanie domowe (nieobowiązkowe)

Zasady zaliczenia laboratorium

  1. Ocena końcowa z laboratorium wystawiana jest na podstawie wyniku procentowego ze sprawdzianu realizowanego na ostatnich zajęciach.
  2. Warunkiem koniecznym do otrzymania zaliczenia z laboratorium jest zaliczenie sprawdzianu (>50% punktów). Stosuje się następującą skalę punktową: >50% 3, >60% 3.5, >70% 4, >80% 4.5, >90% 5.
  3. Sprawdzian składa się zarówno z zadań teoretycznych jak i praktycznych, otwartych i zamkniętych.
  4. W przypadku niezaliczenia przedmiotu student ma prawo do jednej (i tylko jednej) poprawki, która odbywa się na takich samych zasadach jak zaliczenie.
  5. W przypadku nieusprawiedliwionej nieobecności na zaliczeniu student traci możliwość poprawki, a swoje zaliczenie pisze w terminie poprawki. W przypadku nieusprawiedliwionej nieobecności na poprawce student traci możliwość zaliczenia przedmiotu.