Statistical Data Analysis


Statystyka i Analiza Danych dla studentów stacjonarnych

To już koniec naszej statystycznej przygody :(

Kilka miesięcy temu zaczynaliśmy z głową pełną pytań o analizę danych - co mogę z danych odkryć?, czy moje wyniki będą wiarygodne?, czy można się czegoś z danych "nauczyć"?
W czasie (niełatwych przecież) zajęć dowiedzieliśmy się jak wykorzystać statystykę do optymalizacji baz danych, jak zoptymalizować interfejs aplikacji używając technik testowania A/B, jak przewidzieć ocenę filmu jeszcze przed jego premierą, dlaczego model prostszy może działać lepiej niż model skomplikowany, a nawet odkryliśmy, że trafienie szóstki kostką nie ma prawdopodobieństwa 1/6!
Dodatkowo wyrobiliście sobie pewne nawyki których pewnie sobie nawet nie uświadamiacie: średnia? - a co jak są outliery?; test? - czy aby na pewno założenia były spełnione?, nie odrzuciliśmy hipotezy? - czy rzeczywiście świadczy to o jej prawdziwości?; odrzuciliśmy? - czy aby na pewno jest to praktycznie istotne?, dane pokazują trend? - czy przypadkiem nie wziął on się z czystej losowości?, korelacja? - czy to związek przyczynowo-skutkowy?
To był intensywny czas, ale mam nadzieję, że było warto ;)

tak jak dziś nie można żyć bez umiejętności czytania, tak jutro nie będzie można żyć bez umiejętności czytania danych

Serdecznie gratuluję i życzę powodzenia w dalszym poszerzaniu wiedzy z analizy danych!

Wyniki grupy: wtorek i czwartek
Ocena zajęć za półmetkiem II: tutaj



Korelacja i regresja 3

Laboratorium 14(*)

Temat dodatkowy
Regresja wieloraka (cd.), zmienne nominalne w modelu regresji, testowanie wielokrotne, uogólnione modele liniowe

Opis i materiały dydaktyczne

Statystyka nieparametryczna

Laboratorium 13

Test znaków, test Wilcoxon'a, test U-Manna-Whitneya, korelacja Spearman'a

Opis i materiały dydaktyczne

Analiza danych jakościowych

Laboratorium 12

Test chi kwadrat na zgodność z rozkładem, test chi kwadrat na niezależność zmiennych dyskretynych, miary siły zależności pomiędzy zmiennymi nominalnymi

Opis i materiały dydaktyczne

Korelacja i regresja 2

Laboratorium 11

Estymacja regresji liniowej, test F, przedziały ufności dla regresji, podstawy diagnostyki modelu regresji, dokonywanie predykcji, regresja wieloraka (cd.), problem ekstrapolacji

Opis i materiały dydaktyczne

Korelacja i regresja

Laboratorium 10

Współczynnik korelacji Pearson'a, test t dla korelacji, regresja liniowa, estymacja metodą najmniejszych kwadratów, regresja wieloraka, transformacje zmiennych wyjaśniających

Opis i materiały dydaktyczne

Testy dla dwóch populacji

Laboratorium 9

Test Z dla dwóch populacji, test t-Studenta dla dwóch populacji przy stałej wariancji, rozkład F, test F

Opis i materiały dydaktyczne

Testy dla średniej przy nieznanej σ

Laboratorium 8

Test t-Studenta, rozkład t, błędy I i II rodzaju, moc testu, test a przedział ufności

Opis i materiały dydaktyczne

Testy dla średniej przy znanej σ

Laboratorium 7

Testy dla średniej i sumy przy znanej σ, test w rozkładzie dwupunktowym

Opis i materiały dydaktyczne

CLT. Estymacja przedziałowa.

Laboratorium 6

Centralne Twierdzenie Graniczne, estymacja przedziałowa

Opis i materiały dydaktyczne

Symulacje. Estymacja punktowa.

Laboratorium 5

Uniwersalność rozkładu jednorodnego, metody Monte Carlo, estymatory zgodne, nieobciążone, efektywne.

Opis i materiały dydaktyczne

Rozkład normalny

Laboratorium 4

Rozkład normalny, rozkład dwupunktowy, reguła 68-95-99.7, standaryzacja, wyliczanie prawdopodobieństw z rozkładu normalnego.

Opis i materiały dydaktyczne

Graficzna analiza danych

Laboratorium 3

Graficzna analiza danych, case study analizy danych z portalów społecznościowych

Opis i materiały dydaktyczne

Statystyka opisowa

Laboratorium 2

Statystyka opisowa, średnia arytmetyczna, harmoniczna, geometryczna, ucinana, mediana, moda, wariancja, odchylenie standardowe, kurtoza, skośność, rozstęp... Analiza i interpretacja powyższych miar.

Opis i materiały dydaktyczne

Wprowadzenie do analizy danych

Laboratorium 1

Wprowadzenie do statystyki, era dużych danych, zastosowania i motywacje analizy danych, różne spojrzenia na dane, rodzaje atrybutów, szeregi rozdzielcze, informacje organizacyjne.

Opis i materiały dydaktyczne

This class is supported by DataCamp, the most intuitive learning platform for data science. Learn R, Python and SQL the way you learn best through a combination of short expert videos and hands-on-the-keyboard exercises. Take over 100+ courses by expert instructors on topics such as importing data, data visualization or machine learning and learn faster through immediate and personalised feedback on every exercise.