Czy można zastosować średni błąd kwadratowy do klasyfikacji?

14

Znam formułę średniej kwadratowej błędu i jak ją obliczyć. Kiedy mówimy o regresji, możemy obliczyć średni błąd kwadratu. Czy jednak możemy porozmawiać o MSE dla problemu klasyfikacji i jak go obliczyć?

classification error kamaci
źródło

12

Wielu klasyfikatorów może przewidzieć ciągłe wyniki. Często ciągłe wyniki są wynikami pośrednimi, które są konwertowane tylko na etykiety klas (zwykle według progów) jako ostatni krok klasyfikacji. W innych przypadkach można np. Obliczyć prawdopodobieństwa wsteczne członkostwa w klasie (np. Analiza dyskryminacyjna, regresja logistyczna). Możesz obliczyć MSE, stosując te ciągłe wyniki, a nie etykiety klas. Zaletą tego jest to, że unikasz utraty informacji z powodu dychotomizacji.
Gdy prawdopodobieństwo ciągłe jest wynikiem, miernik MSE nazywa się wynikiem Briera.

Istnieją jednak również problemy z klasyfikacją, które są raczej problemami regresji w przebraniu. W mojej dziedzinie może to być np. Klasyfikowanie przypadków według tego, czy stężenie niektórych substancji przekracza dozwolony limit, czy też nie (co jest binarnym / dyskryminującym problemem dwóch klas). MSE jest tutaj naturalnym wyborem ze względu na regresyjny charakter zadania.

W tym artykule wyjaśniamy to jako część bardziej ogólnych ram: C. Beleites, R. Salzer i V. Sergo:
Walidacja miękkich modeli klasyfikacji przy użyciu członkostwa w klasie częściowej: rozszerzona koncepcja wrażliwości i spółka zastosowana do klasyfikacji tkanek gwiaździaka
Chemom Intel. Laboratorium. Syst., 122 (2013), 12–22.

Jak to obliczyć: jeśli pracujesz w R, jedna implementacja znajduje się w pakiecie „softclassval”, http: /softclassval.r-forge.r-project.org.

cbeleites niezadowoleni z SX
źródło

@ seanv507: wielkie dzięki!

cbeleites niezadowoleni z SX

1

Nie do końca rozumiem, jak ... udana klasyfikacja jest zmienną binarną (poprawną lub nie), więc trudno jest zobaczyć, co byś wyliczył.

Zasadniczo klasyfikacje są mierzone na podstawie wskaźników, takich jak poprawność procentowa, gdy klasyfikacja, która została oszacowana na podstawie zestawu szkoleniowego, jest stosowana do zestawu testowego, który został odłożony wcześniej.

Średni błąd kwadratowy można oczywiście (i jest) obliczać dla prognoz lub przewidywanych wartości zmiennych ciągłych, ale nie sądzę, że dla klasyfikacji.

Peter Ellis
źródło

0

W przypadku oszacowań prawdopodobieństwa chciałbyś obliczyć nie MSE, ale prawdopodobieństwo: $\hat{\pi}$

$L=\prod_i \hat{\pi}_i^{y_i} (1-\hat{\pi}_i)^{1-y_i}$

Prawdopodobieństwo to dotyczy odpowiedzi binarnej, która, jak się zakłada, ma rozkład Bernoulliego.

Jeśli weźmiesz log a następnie zaprzeczysz, otrzymasz logistyczną utratę, która jest swego rodzaju analogiem MSE, gdy masz binarną odpowiedź. W szczególności MSE jest prawdopodobieństwem logu ujemnego dla ciągłej odpowiedzi, przy założeniu, że ma rozkład normalny. $L$

użytkownik0
źródło

0

Technicznie możesz, ale funkcja MSE nie jest wypukła do klasyfikacji binarnej. Tak więc, jeśli model klasyfikacji binarnej zostanie przeszkolony z funkcją Koszt MSE, nie ma gwarancji zminimalizowania funkcji Koszt . Również użycie MSE jako funkcji kosztu zakłada rozkład Gaussa, co nie ma miejsca w przypadku klasyfikacji binarnej.

Mostafa Nakhaei
źródło

1

Dlaczego MSE miałoby zakładać rozkład Gaussa? (W przeciwieństwie do powiedzmy, że regresja metodą najmniejszych kwadratów używa MSE jako straty, i możemy wykazać, że jest optymalna w przypadku problemów z regresją z

resztami

Nie jest optymalny do klasyfikacji binarnej, ale optymalny do regresji. Pytanie dotyczyło wersji binarnej.

Mostafa Nakhaei

Pytanie nie mówi o klasyfikacji binarnej . Nie mówi nawet o dyskryminacji. I nie pyta o optymalność (dla której musisz być bardziej konkretny w tej sytuacji, nawet niż mówiąc binarną lub dyskryminującą z 2 klasami), tylko czy można użyć MSE. Ponadto wynik Briera jest ściśle właściwą regułą punktacji do prognozowania, więc bardziej szczegółowe wyjaśnienie nieoptymalności byłoby z pewnością pomocne (i być może bardzo pouczające, kiedy ta nieoptymalność ma zastosowanie).

cbeleites niezadowoleni z SX

Czy można zastosować średni błąd kwadratowy do klasyfikacji?

Odpowiedzi: