Korekta ciągłości Yatesa dla tabel awaryjności 2 x 2

9

Chciałbym zebrać informacje od ludzi w terenie na temat korekty ciągłości Yatesa dla tabel awaryjności 2 x 2. Artykuł w Wikipedii wspomina, że może się za bardzo dostosować, dlatego jest używany tylko w ograniczonym sensie. Związane post tutaj nie oferuje znacznie głębszy wgląd.

Więc co myślisz o ludziach, którzy regularnie korzystają z tych testów? Czy lepiej jest użyć korekty, czy nie?

I przykład z prawdziwego świata, który przyniósłby różne wyniki przy poziomie ufności 95%. Zauważ, że to był problem z pracą domową, ale nasza klasa w ogóle nie zajmuje się korektą ciągłości Yatesa, więc śpij spokojnie wiedząc, że nie odrabiasz mojej pracy domowej dla mnie.

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)

categorical-data chi-squared yates-correction Gonić
źródło

6

Korekta Yatesa powoduje, że testy są bardziej konserwatywne niż w przypadku „dokładnych” testów Fishera.

Oto samouczek online na temat stosowania korekty ciągłości Yatesa , autorstwa Stefanescu i in., Który wyraźnie wskazuje na różne wady systematycznej korekty ciągłości (s. 4-6). Cytując Agresti ( CDA 2002), „Yates (1934) wspomniał, że Fisher zasugerował mu hipergeometrię dla dokładnego testu”, co doprowadziło do skorygowanej ciągłości wersji $\chi^2$ . Agresti wskazał również, że test Fishera jest dobrą alternatywą, ponieważ komputery mogą to zrobić nawet w przypadku dużych próbek (s. 103). Chodzi o to, że wybór testu naprawdę zależy od postawionego pytania i założeń każdego z nich (np. W przypadku testu Fishera zakładamy, że marginesy są stałe).

W twoim przypadku Fisher przetestował i poprawił $\chi^2$ zgadzam się i ustępuję $p$ -wartość powyżej 5%. W przypadku zwykłego $\chi^2$ , gdyby $p$ -wartości są obliczane przy użyciu podejścia Monte Carlo (patrz simulate.p.value), a następnie nie osiąga również znaczenia.

Inne przydatne odniesienia dotyczące problemów z małą wielkością próby i nadużywania testu Fishera obejmują:

I. Testy Campbella, Chi-kwadrat i Fishera – Irwina dla tabel dwa na dwa z zaleceniami dla małych próbek , Statistics in Medicine 26 (19): 3661–3675, 2007.
Mark G. Haviland, korekta ciągłości Yatesa i analiza tablic awaryjnych 2 × 2 , Statistics in Medicine 9 (4): 363–367, 1990.

chl
źródło

Dzięki za referencje. Udało mi się znaleźć „pre-print” wersję referatu Campbell tutaj dla tych, którzy nie mają dostępu Pub Med.

Chase

3

Jeśli masz wystarczająco małą liczbę, aby Korekta Yatesa była zmartwieniem (jak w twoim przykładzie), prawdopodobnie powinieneś użyć dokładnego testu Fishera. W przeciwnym razie zalecam, aby po użyciu testu chi-kwadrat na stole 2x2 potwierdzić test za pomocą testu logarytmicznego ilorazu prawdopodobieństwa.

Mike Anderson
źródło

Po co sprawdzać logarytm z ilorazem szans z -test? To test Walda, a testy Walda zwykle wypadają gorzej niż testy punktowe, takie jak test chi-kwadrat Pearsona. Czy jest to znany wyjątek?

onestop

dzięki za informację! Test Fishera wydaje się być bardziej niezawodną metodą na takie pytania. Nie sądzę, że kurs, który aktualnie biorę, dotyczy testu Fishera, ale na pewno będę o tym pamiętać w aplikacjach w świecie rzeczywistym.

Chase

Korekta ciągłości Yatesa dla tabel awaryjności 2 x 2

Odpowiedzi: