Test G vs test chi-kwadrat Pearsona

10

Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte Carlo do obliczenia wartości p, więc czy jest jakaś różnica między tymi dwoma testami?N×M

oodkan
źródło
1
Zobacz Deviance vs Pearson goodness-of-fit .
Scortchi - Przywróć Monikę

Odpowiedzi:

8

Są asymptotycznie takie same. Są po prostu różnymi sposobami na uzyskanie tego samego pomysłu. Mówiąc dokładniej, test chi-kwadrat Pearsona jest testem punktacji, podczas gdy test G jest testem współczynnika prawdopodobieństwa. Aby lepiej zrozumieć te pomysły, pomocne może być przeczytanie mojej odpowiedzi tutaj: Dlaczego moje wartości p różnią się między wynikami regresji logistycznej, testem chi-kwadrat i przedziałem ufności dla OR? Aby odpowiedzieć na twoje bezpośrednie pytanie, jeśli obliczasz wartość p za pomocą symulacji Monte Carlo, nie powinno to mieć znaczenia; możesz użyć tej, która jest dla Ciebie wygodniejsza. Zauważ, że nie ma problemu z niską liczbą komórek, tylko (potencjalnie) niska oczekiwanaliczba komórek; możliwe jest posiadanie niskiej liczby komórek i oczekiwanie, że liczby będą w porządku. Co więcej, ani niskie rzeczywiste liczby, ani niskie oczekiwane liczby nie mają znaczenia, gdy wartość p jest określana na podstawie symulacji.

(Do tego, co jest warte, prawdopodobnie użyłbym chi-kwadrat Pearsona, ponieważ R ma do tego wygodną funkcję, która obejmuje opcję symulacji wartości p).

gung - Przywróć Monikę
źródło
jaka jest funkcja w R?
llewmills
@llewmills, chisq.test.
gung - Przywróć Monikę
1

Spójrz na Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Odpowiednie polecenia to g2Test_univariate (dane, dc) g2Test_univariate_perm (dane, dc, nperm) Obliczenia są niezwykle szybkie. I ogólnie wolę test G ^ 2, ponieważ chi-kwadrat jest jego przybliżeniem.

Michail
źródło
-1

Test chi-kwadrat i test G zwykle dają podobne wyniki. Ale najważniejsze jest to, że musisz wybrać jeden z dwóch testów i trzymać się go, nie tylko dla wspomnianego testu, ale dla przyszłych testów w trakcie badań. Jest to wskazane, ponieważ jeśli spróbujesz zastosować oba testy zamiennie, bardzo prawdopodobne jest, że zwiększysz szansę na uzyskanie fałszywie dodatniego wyniku.

mały potwór
źródło
2
Jakie jest uzasadnienie, według którego zwiększa się prawdopodobieństwo fałszywego pozytywu? (Chyba że masz zamiar zasugerować, że test jest wybierany przez odniesienie do faktycznych liczb - ale wtedy chodzi o odniesienie się do liczb do wyboru między nimi to jest problem, a nie pomysł potencjalnej zamiany testów per se)
Glen_b
2
@Glen_b Prawdopodobieństwo uzyskania fałszywego wyniku pozytywnego prawdopodobnie wzrośnie, jeśli wybierzemy wartość p testu, która jest bardziej korzystna dla naszych założeń (w przypadku, gdy wypróbujemy oba testy)
little_monster