Test statystyczny dla dodatniej i ujemnej wartości predykcyjnej

12

Czytałem artykuł i zobaczyłem tabelę z porównaniem PPV (dodatnia wartość predykcyjna) i NPV (ujemna wartość predykcyjna). Zrobili dla nich jakiś test statystyczny, to jest szkic tabeli:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Każdy wiersz odnosi się do konkretnej tabeli awaryjnej.

Jakiego rodzaju test hipotez przeprowadzili? Dzięki!

Simone
źródło

Odpowiedzi:

17

Zakładając krzyżową klasyfikację, taką jak ta pokazana poniżej (tutaj, w przypadku instrumentu przesiewowego)

alternatywny tekst

możemy zdefiniować cztery miary dokładności badań przesiewowych i mocy predykcyjnej:

  • Czułość (se), a / (a ​​+ c), tj. Prawdopodobieństwo badania przesiewowego zapewniającego wynik dodatni, biorąc pod uwagę obecność choroby;
  • Specyficzność (sp), d / (b + d), tj. Prawdopodobieństwo badania przesiewowego zapewniającego wynik ujemny, biorąc pod uwagę brak choroby;
  • Pozytywna wartość predykcyjna (PPV), a / (a ​​+ b), tj. Prawdopodobieństwo pacjentów z pozytywnymi wynikami testu, którzy zostaną prawidłowo zdiagnozowani (jako dodatni);
  • Negatywna wartość predykcyjna (NPV), d / (c + d), tj. Prawdopodobieństwo pacjentów z ujemnymi wynikami testu, którzy zostaną prawidłowo zdiagnozowani (jako ujemni).

Każda z czterech miar to proste proporcje obliczone na podstawie zaobserwowanych danych. Odpowiednim testem statystycznym byłby zatem test dwumianowy (dokładny) , który powinien być dostępny w większości pakietów statystycznych lub w wielu kalkulatorach online. Testowana hipoteza dotyczy tego, czy zaobserwowane proporcje istotnie różnią się od 0,5, czy nie. Uważam jednak, że bardziej interesujące jest zapewnienie przedziałów ufności niż pojedynczego testu istotności, ponieważ daje informacje o precyzji pomiaru. W każdym razie, aby odtworzyć pokazane wyniki, musisz znać całkowite marginesy swojej dwustronnej tabeli (podałeś tylko PPV i NPV jako%).

Jako przykład załóżmy, że obserwujemy następujące dane (kwestionariusz CAGE to kwestionariusz przesiewowy dotyczący alkoholu):

alternatywny tekst

następnie w R PPV oblicza się w następujący sposób:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

Jeśli używasz SAS, możesz zapoznać się z uwagą dotyczącą wykorzystania 24170: Jak oszacować czułość, swoistość, dodatnie i ujemne wartości predykcyjne, fałszywie dodatnie i ujemne prawdopodobieństwa oraz współczynniki prawdopodobieństwa? .

Aby obliczyć przedziały ufności, przybliżenie gaussowskie, (1,96 jest kwantylem standardowego rozkładu normalnego przy lub z %), jest stosowany w praktyce, zwłaszcza gdy proporcje są dość małe lub duże (co często ma miejsce tutaj).p±1,96×p(1-p)/np=0,9751-α/2)α=5

Więcej informacji można znaleźć na

Newcombe, RG. Dwustronne przedziały ufności dla pojedynczego odsetka: porównanie siedmiu metod . Statistics in Medicine , 17, 857-872 (1998).

chl
źródło
Dzięki. Ok, czytałem na samym początku artykułu, że zastosowali test chi-kwadrat dla wszystkich zmiennych kategorialnych. Zapisana tabela klasyfikacji nie odnosi się w szczególności do zmiennej, jest to wynik zadania klasyfikacyjnego. To nie jest bardzo jasne! Teraz przypuszczam, że zrobili klasyczny test na proporcje .. może Chi-kwadrat ..
Simone
Znów przyjrzałem się temu pytaniu i zobaczyłem, że wartość p nie odnosi się ani do PPV, ani do NPV, odnosi się do całego wiersza. Myślę, że test, który mieli, powinien być powiązany z całą tabelą awaryjną.
Simone
@ Simone Więc jeśli dobrze cię rozumiem, sugerujesz, aby autorzy podali wartości PPV i NPV, ale podali wartość p odpowiadającą globalnemu testowi asocjacji tabeli 2x2? Czy ma to związek z tym ostatnim pytaniem, stats.stackexchange.com/questions/9464/… ?
chl
Tak, byłoby to związane z tym pytaniem, gdyby wartość p była powiązana albo z PPV, albo z NPV. I w takim przypadku dałeś rozwiązanie. Test odpowiada całej tabeli 2x2, nigdy nie będę wiedział, jaki to test!
Simone
1

Proszę zobaczyć

Kosiński, Andrzej S. Ważona uogólniona statystyka punktowa do porównania wartości predykcyjnych testów diagnostycznych. Statystyka w medycynie http://dx.doi.org/10.1002/sim.5587 opublikowana online: 22 sierpnia 2012 r

Andrzej Kosiński
źródło