Dlaczego test McNemara wykorzystuje chi-kwadrat, a nie rozkład normalny?

11

Właśnie zauważyłem, jak nieprecyzyjny test McNemara wykorzystuje asymptotyczny rozkład chi-kwadrat. Ale skoro dokładny test (dla tabeli dwóch przypadków) opiera się na rozkładzie dwumianowym, dlaczego nie jest tak często sugerować normalne przybliżenie do rozkładu dwumianowego?

Dzięki.

Tal Galili
źródło

Odpowiedzi:

15

Prawie intuicyjna odpowiedź:

Przyjrzyj się bliżej formule testu McNemar podanej w tabeli

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

Statystyka McNemar Mjest obliczana jako:

M=(bc)2b+c

χ2bcb-cb+cMχ2


EDYCJA: Jak słusznie wskazano na początku, normalne przybliżenie jest w rzeczywistości całkowicie równoważne. Jest to dość trywialne, biorąc pod uwagę argument wykorzystujący aproksymację b-crozkładu normalnego.

bBinom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

Lub równoważnie:

b(b+c2)b+c2N(0,1)

co upraszcza

bcb+cN(0,1)

Mχ12

χ2

Joris Meys
źródło
3
Zgadza się. Połączenie może być lepiej widoczne, biorąc pod uwagę Sqrt (M) = (bc) / Sqrt (b + c). Przybliżając wariancję b jako b i wariancję c jako c (jak to zwykle bywa w danych zliczonych), widzimy, że Sqrt (M) wygląda jak w przybliżeniu normalna wariacja (bc) podzielona przez jej odchylenie standardowe: innymi słowy, to wygląda jak standardowa zmienna normalna. W rzeczywistości moglibyśmy przeprowadzić równoważny test, odnosząc Sqrt (M) do tabeli standardowego rozkładu normalnego. Kwadratowanie go skutecznie sprawia, że ​​test jest symetryczny dwustronny. Oczywiście to się psuje, jeśli b lub c jest małe.
whuber
Dziękuję za intuicyjną odpowiedź Joris. Dlaczego jednak częściej stosuje się to przybliżenie niż normalne przybliżenie do dokładnego dwumianowego testu McNemara?
Tal Galili,
@Tal: Tak samo. Zobacz odpowiedź nonstops i moją edycję.
Joris Meys,
Właściwie - ostatnie pytanie. Więc jeśli oba są identyczne (i myślę, że może być również potrzebna „wartość bezwzględna” wokół BC), to dlaczego ludzie chodzą do rozkładu chi zamiast pozostać przy normalnym? Gdzie jest zaleta?
Tal Galili
1
@Tal: Wiesz, R. spiskujesz chi2 z jednym stopniem swobody, zobaczysz.
Joris Meys,
8

Czy te dwa podejścia nie dojdą do tego samego? Odpowiedni rozkład chi-kwadrat ma jeden stopień swobody, więc jest to po prostu rozkład kwadratu zmiennej losowej ze standardowym rozkładem normalnym. Musiałbym przejść przez algebrę, aby sprawdzić, czego nie mam teraz na to czasu, ale byłbym zaskoczony, gdybyś nie skończył z dokładnie tą samą odpowiedzią w obie strony.

jeden przystanek
źródło
zobacz moją odpowiedź do dalszego opracowania
Joris Meys,
Cześć onestop - Ponieważ oba są asymptotyczne, więc dla mniejszych N mogą dawać nieco inne wyniki. W takim przypadku zastanawiam się, czy wybór przejścia na chi-kwadrat wynika z tego, że jest lepszy niż normalne przybliżenie, czy też z przyczyn historycznych (a może, jak sugerowałeś - zawsze dają identyczne wyniki)
Tal Galili,
@Tal: dla mniejszych N żadne z nich nie ma. I jak pokazano w mojej edycji, są dokładnie takie same.
Joris Meys,