Połączenia między

13

W uczeniu maszynowym możemy wykorzystać obszar pod krzywą ROC (często skracany AUC lub AUROC), aby podsumować, jak dobrze system może rozróżniać dwie kategorie. W teorii wykrywania sygnału często stosuje się (wskaźnik czułości) do podobnego celu. Oba są ściśle ze sobą powiązane i uważam, że są sobie równe, jeśli pewne założenia są spełnione .d

obliczenie przedstawia się zwykle na podstawie założeniu normalnych rozkładów dla rozkładu sygnału (patrz odwołuje powyżej, na przykład). Obliczenie krzywej ROC nie przyjmuje tego założenia: ma zastosowanie do każdego klasyfikatora, który generuje kryterium decyzyjne o wartości ciągłej, które można progować.d

Wikipedia twierdzi, że jest równoważne . Wydaje się to słuszne, jeśli założenia obu są spełnione; ale jeśli założenia nie są takie same, to nie jest to uniwersalna prawda. 2 AUC - 1d2AUC1

Czy słusznie jest scharakteryzować różnicę w założeniach jako „AUC czyni mniej założeń dotyczących podstawowych rozkładów”? A może jest tak samo szeroko stosowane jak AUC, ale jest to po prostu powszechna praktyka, że ​​ludzie używający mają tendencję do korzystania z obliczeń, które zakładają normalne rozkłady? Czy są jakieś inne różnice w podstawowych założeniach, które przeoczyłem?d dd

Dan Stowell
źródło

Odpowiedzi:

7

Nie. Maksymalna wartość AUC wynosi 1. d 'nie ma wartości maksymalnej.

Uważam, że d 'jest równe qnorm (AUC) * sqrt (2) (mojej pamięci starej księgi statystyk, której nie mogę teraz znaleźć, ale wydaje się, że sprawdzam niektóre dane znalezione w sieci). Tutaj qnorm (x) jest „funkcją kwantylu dla rozkładu normalnego” (R-speak). Oznacza to, że zwraca wartość rozkładu normalnego, dla którego x proporcja rozkładu jest poniżej niego.

Joel Lachter
źródło
2
Dzięki, to brzmi dla mnie poprawnie - jednak tylko jeśli założymy, że rozkłady są normalne (z powodu użycia qnorm ()). Poprawiłem brzmienie Wikipedii.
Dan Stowell,