Biorąc pod uwagę wskaźniki prawdziwie dodatnie, fałszywie ujemne, czy możesz obliczyć wartości fałszywie dodatnie, prawdziwie ujemne?

24

Mam wartości True Positive (TP)i False Negative (FN)następujące:

TP = 0.25
FN = 0.75

Na podstawie tych wartości możemy obliczyć False Positive (FP)i True Negative (TN)?

Prostota
źródło

Odpowiedzi:

53

W tym obszarze istnieje sporo nieporozumień terminologicznych. Osobiście zawsze myślę o tym, aby wrócić do matrycy pomieszania. W teście klasyfikacji / badania przesiewowego możesz mieć cztery różne sytuacje:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

W tej tabeli „prawdziwie pozytywne”, „fałszywie ujemne”, „fałszywie pozytywne” i „prawdziwe negatywne” to zdarzenia (lub ich prawdopodobieństwo). To, co masz, to prawdopodobnie prawdziwie dodatni wskaźnik i fałszywie ujemny wskaźnik . Rozróżnienie ma znaczenie, ponieważ podkreśla, że ​​obie liczby mają licznik i mianownik.

Sprawy stają się nieco mylące, ponieważ można znaleźć kilka definicji „współczynnika fałszywie dodatniego” i „współczynnika fałszywie ujemnego” o różnych mianownikach.

Na przykład Wikipedia zawiera następujące definicje (wydają się dość standardowe):

  • Prawdziwie dodatni współczynnik (lub czułość):T.P.R=T.P./(T.P.+faN.)
  • Fałszywie dodatni wskaźnik:faP.R=faP./(faP.+T.N.)
  • Prawdziwa stopa ujemna (lub swoistość):T.N.R=T.N./(faP.+T.N.)

We wszystkich przypadkach mianownik to suma kolumn . Daje to również wskazówkę do ich interpretacji: prawdziwa wartość dodatnia to prawdopodobieństwo, że test powie „A”, gdy rzeczywistą wartością jest rzeczywiście A (tj. Jest to prawdopodobieństwo warunkowe, uzależnione od prawdziwości A). Ten sposób nie powiedzieć, jak prawdopodobne jest to, aby być poprawne podczas wywoływania „a” (czyli prawdopodobieństwo prawdziwego pozytywny, uzależnione od wyników testu jest „A”).

Zakładając, że współczynnik fałszywie ujemny jest zdefiniowany w ten sam sposób, mamy (zauważ, że twoje liczby są z tym zgodne). Nie możemy jednak bezpośrednio wyprowadzić wskaźnika fałszywie dodatniego na podstawie współczynników prawdziwego dodatniego lub fałszywie ujemnego, ponieważ nie dostarczają one żadnych informacji na temat specyficzności, tj. Jak zachowuje się test, gdy „nie A” jest prawidłową odpowiedzią. Odpowiedź na twoje pytanie brzmiałaby zatem „nie, to niemożliwe”, ponieważ nie masz informacji w prawej kolumnie macierzy zamieszania.faN.R=1-T.P.R

Istnieją jednak inne definicje w literaturze. Na przykład Fleiss ( metody statystyczne dotyczące stawek i proporcji ) oferuje:

  • „[…] Wskaźnik fałszywie dodatnich […] to odsetek osób, wśród osób pozytywnie reagujących, które faktycznie są wolne od choroby”.
  • „Współczynnik fałszywie ujemnych […] to odsetek osób, wśród osób, które odpowiedziały negatywnie w teście, a mimo to chorują”.

(Przyznaje także poprzednie definicje, ale uważa je za „marnowanie cennej terminologii”, właśnie dlatego, że mają bezpośredni związek z wrażliwością i specyficznością.)

Odnosząc się do macierzy zamieszania, oznacza to, że i więc mianownikami są sumy wierszy . Co ważne, zgodnie z tymi definicjami współczynników fałszywie dodatnich i fałszywie ujemnych nie można bezpośrednio wyprowadzić z czułości i swoistości testu. Musisz także znać częstość występowania (tj. Częstotliwość A w badanej populacji).faP.R=faP./(T.P.+faP.)faN.R=faN./(T.N.+faN.)

Fleiss nie używa ani nie definiuje zwrotów „prawdziwa ujemna stopa” lub „prawdziwie dodatnia stopa”, ale jeśli założymy, że są to również prawdopodobieństwa warunkowe przy danym wyniku testu / klasyfikacji, to odpowiedź @ guill11aume jest prawidłowa.

W każdym razie musisz zachować ostrożność z definicjami, ponieważ nie ma niepodważalnej odpowiedzi na twoje pytanie.

Gala
źródło
4
Bardzo dobrze (+1). Natychmiast skoczyłem na jedną interpretację, ale masz całkowitą rację, że alternatywna definicja jest standardowa.
gui11aume
1
@ gui11aume. Dzięki! To było moje uczucie, ale myśląc o tym, nie jestem już taki pewien. Patrząc na referencje, może zależeć od dziedziny (uczenie maszynowe vs. testy medyczne).
Gala
Z mojego doświadczenia wynika, że ​​ta ostatnia definicja, TPR = TP / (TP + FP), FPR = FP / (TP + FP) jest bardziej standardowa.
travelingbones
1
Oto publikacja na różnicach: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Uwaga nowa terminologia „Test FPR” vs. „Przewidywanie FPR”
travelingbones
8

EDYCJA: zobacz odpowiedź Gaëla Lauransa, która jest dokładniejsza.

Jeśli twój prawdziwy współczynnik dodatni wynosi 0,25, oznacza to, że za każdym razem, gdy wywołujesz wskaźnik dodatni, prawdopodobieństwo błędu wynosi 0,75. To jest twój fałszywie pozytywny wskaźnik. Podobnie, za każdym razem, gdy wywołujesz przeczenie, masz prawdopodobieństwo 0,25 bycia w porządku, co jest twoim prawdziwym ujemnym współczynnikiem.

gui11aume
źródło
Zależy od tego, co próbuje się scharakteryzować: test w otoczeniu na poznanie prawdy z góry lub próba ustalenia prawdopodobieństwa potestu właśnie na podstawie podanych wyników.
kd4ttc
3

Brak, jeśli ma to sens, jeśli „pozytywne” i „negatywne” nie mają sensu dla danego problemu. Widzę wiele problemów, w których „pozytywne” i „negatywne” to arbitralne wymuszone wybory zmiennej porządkowej lub ciągłej. FP, TP, sens, spec są użyteczne tylko w przypadku zjawisk typu „wszystko albo nic”.

Frank Harrell
źródło