Mam problem z 6 klasami. Buduję klasyfikator wieloklasowy w następujący sposób: dla każdej klasy mam jeden klasyfikator regresji logistycznej, używając One vs. All, co oznacza, że mam 6 różnych klasyfikatorów.
Mogę zgłosić macierz nieporozumień dla każdego z moich klasyfikatorów. Chciałbym jednak zgłosić macierz nieporozumień dla WSZYSTKICH klasyfikatorów, co widziałem w wielu przykładach tutaj.
Jak mogę to zrobić? Czy muszę zmienić strategię klasyfikacji, stosując algorytm jeden na jednego zamiast jeden na wszystkich? Ponieważ na tych macierzach zamieszania, raporty mówią fałszywie pozytywne dla każdej klasy.
Przykład wieloklasowej macierzy zamieszania
Chciałbym znaleźć liczbę błędnie sklasyfikowanych przedmiotów. W pierwszym rzędzie znajduje się 137 przykładów klasy 1, które zostały sklasyfikowane jako klasa 1 oraz 13 przykładów klasy 1, które zostały zaklasyfikowane jako klasa 2 . Jak zdobyć ten numer?
Odpowiedzi:
Przypuszczalnie używasz tych klasyfikatorów, aby pomóc wybrać jedną konkretną klasę dla danego zestawu wartości cech (jak powiedziałeś, że tworzysz klasyfikator wieloklasowy).
Powiedzmy, że maszN. klas, wtedy macierz pomieszania byłaby an N.× N. macierz, przy czym lewa oś pokazuje prawdziwą klasę (znaną w zestawie testowym), a górna oś pokazuje klasę przypisaną do elementu o tej prawdziwej klasie. Każdy elementja , j macierzy to liczba pozycji z prawdziwą klasą ja które zostały sklasyfikowane jako należące do klasy jot .
Jest to proste rozszerzenie 2-klasowej macierzy pomyłek.
źródło
Chociaż na tym forum jest już kilka odpowiedzi, pomyślałem, że podam wyraźne równania, aby uczynić je bardziej precyzyjnymi:
Zakładając, że masz wieloklasową macierz zamieszania w formie,do= Rzeczywistedo11⋮don 1Sklasyfikowane. . .⋱do1 ndon n
Elementy zamieszania dla każdej klasy podano przez:
źródło
Wykorzystując macierz dołączoną do pytania i biorąc pod uwagę wartości w osi pionowej jako rzeczywistą klasę, a wartości w osi poziomej prognozę. Następnie dla klasy 1:
137
-> próbki klasy 1, sklasyfikowane jako klasa 16
-> (1 + 2 + 4) próbki klas 2, 3 i 4, ale sklasyfikowane jako klasa 118
-> (13 + 3 + 1 + 1) próbki klasy 1, ale sklasyfikowane jako klasy 2, 3, 6 i 7581
-> (55 + 1 + 6 ... + 2 + 26) Suma wszystkich wartości w macierzy oprócz tych z kolumny 1 i wiersza 1źródło