Rozważ macierz wejściową i wyjście binarne .
Częstym sposobem pomiaru wydajności klasyfikatora jest użycie krzywych ROC.
Na wykresie ROC przekątna jest wynikiem, który można uzyskać z losowego klasyfikatora. W przypadku niezrównoważonego wyjścia wydajność losowego klasyfikatora można poprawić, wybierając lub z różnymi prawdopodobieństwami.
Jak wydajność takiego klasyfikatora można przedstawić na wykresie krzywej ROC? Przypuszczam, że powinna to być linia prosta o innym kącie, a nie przekątna?
Odpowiedzi:
Krzywe ROC są niewrażliwe na równowagę klas. Linia prosta, którą otrzymujesz dla losowego klasyfikatora, jest już wynikiem użycia różnych prawdopodobieństw uzyskania dodatniej wartości (0 prowadzi do (0, 0), a 1 prowadzi do (1, 1) z dowolnym zakresem między nimi).
Nic nie zmienia się w niezrównoważonym otoczeniu.
źródło