Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte Carlo do obliczenia wartości p, więc czy jest jakaś różnica między tymi dwoma testami?
10
Odpowiedzi:
Są asymptotycznie takie same. Są po prostu różnymi sposobami na uzyskanie tego samego pomysłu. Mówiąc dokładniej, test chi-kwadrat Pearsona jest testem punktacji, podczas gdy test G jest testem współczynnika prawdopodobieństwa. Aby lepiej zrozumieć te pomysły, pomocne może być przeczytanie mojej odpowiedzi tutaj: Dlaczego moje wartości p różnią się między wynikami regresji logistycznej, testem chi-kwadrat i przedziałem ufności dla OR? Aby odpowiedzieć na twoje bezpośrednie pytanie, jeśli obliczasz wartość p za pomocą symulacji Monte Carlo, nie powinno to mieć znaczenia; możesz użyć tej, która jest dla Ciebie wygodniejsza. Zauważ, że nie ma problemu z niską liczbą komórek, tylko (potencjalnie) niska oczekiwanaliczba komórek; możliwe jest posiadanie niskiej liczby komórek i oczekiwanie, że liczby będą w porządku. Co więcej, ani niskie rzeczywiste liczby, ani niskie oczekiwane liczby nie mają znaczenia, gdy wartość p jest określana na podstawie symulacji.
(Do tego, co jest warte, prawdopodobnie użyłbym chi-kwadrat Pearsona, ponieważ R ma do tego wygodną funkcję, która obejmuje opcję symulacji wartości p).
źródło
chisq.test
.Spójrz na Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Odpowiednie polecenia to g2Test_univariate (dane, dc) g2Test_univariate_perm (dane, dc, nperm) Obliczenia są niezwykle szybkie. I ogólnie wolę test G ^ 2, ponieważ chi-kwadrat jest jego przybliżeniem.
źródło
Test chi-kwadrat i test G zwykle dają podobne wyniki. Ale najważniejsze jest to, że musisz wybrać jeden z dwóch testów i trzymać się go, nie tylko dla wspomnianego testu, ale dla przyszłych testów w trakcie badań. Jest to wskazane, ponieważ jeśli spróbujesz zastosować oba testy zamiennie, bardzo prawdopodobne jest, że zwiększysz szansę na uzyskanie fałszywie dodatniego wyniku.
źródło