Uczenie maszynowe w R

Dariusz Brzeziński

Część II: Regresja i miary oceny

Agenda

  • Regresja za pomocą caret
  • Miary ocen
    • macierz pomyłek
    • miary jedno- i wielo-klasowe
    • rankery
    • krzywa ROC
    • klasyfikatory probabilistyczne

Uczenie maszynowe - przypomnienie

  • Nadzorowane
    • klasyfikacja (Logistic Regression, CART, ID3, ANN, Ripper, PART, Bagging, Boosting, Random Forest)
    • regresja (regresja liniowa, regresja nieliniowa, GBM, SGD)
  • Nienadzorowane
    • grupowanie (k-means, AHC, DBSCAN, OPTICS, Birch, SOM)
    • reguły asocjacyjne (Apriori, FP-Growth)

Zadanie z poprzednich zajęć

  • Załaduj zbiór danych churn:
library(modeldata)
data(mlc_churn)
churnData <- data.frame(mlc_churn)
  • Podziel ten zbiór na uczący i testowy (75% w zbiorze uczącym)
  • Przetestuj dwa algorytmy klasyfikacyjne
  • Zastanów się czy warto wstępnie przetworzyć zbiór
  • Określ przestrzeń przeszukiwania parametrów
  • Porównaj algorytmy za pomocą wykresu

Miary oceny - prawdopodobieństwa

Klasyfikatory zwracające prawdopodobieństwo można oceniać miarami stosowanymi do problemow regresji.

Nie dla każdego algorytmu zwracane pradopodobieństwa odpowiadają prawdopodobieństwu poprawnej odpowiedzi. Proces dopasowywania prawdopodobieństw zwracanych przez klasyfikator do rozkładów nazywa się kalibracją.

Podsumowanie

  • Regresja za pomocą caret
  • Miary ocen
    • macierz pomyłek
    • miary jedno- i wielo-klasowe
    • rankery
    • krzywa ROC
    • klasyfikatory probabilistyczne

Przydatne zasoby