Testuję niezależność dwóch zmiennych, A i B, stratyfikowanych według C. A i B są zmiennymi binarnymi, a C jest kategoryczne (5 wartości). Przeprowadzając dokładny test Fishera dla A i B (wszystkie warstwy łącznie), otrzymuję:
## (B)
## (A) FALSE TRUE
## FALSE 1841 85
## TRUE 915 74
OR: 1.75 (1.25 -- 2.44), p = 0.0007 *
gdzie OR jest ilorazem szans (oszacowanie i 95% przedział ufności) i *
oznacza, że p <0,05.
Uruchamiając ten sam test dla każdej warstwy (C), otrzymuję:
C=1, OR: 2.31 (0.78 -- 6.13), p = 0.0815
C=2, OR: 2.75 (1.21 -- 6.15), p = 0.0088 *
C=3, OR: 0.94 (0.50 -- 1.74), p = 0.8839
C=4, OR: 1.48 (0.77 -- 2.89), p = 0.2196
C=5, OR: 3.38 (0.62 -- 34.11), p = 0.1731
Wreszcie, uruchamiając test Cochran-Mantel-Haenszel (CMH), używając A, B i C, otrzymuję:
OR: 1.56 (1.12 -- 2.18), p = 0.0089 *
Wynik testu CMH sugeruje, że A i B nie są niezależne w każdej warstwie (p <0,05); jednak większość testów wewnątrz warstwy była nieistotna, co sugerowałoby, że nie mamy wystarczających dowodów, aby odrzucić, że A i B są niezależne w każdej warstwie.
Jaki wniosek jest słuszny? Jak zgłosić wniosek, biorąc pod uwagę te wyniki? Czy C można uznać za zmienną mylącą, czy nie?
EDYCJA: Przeprowadziłem test Breslow-Day dla hipotezy zerowej, że iloraz szans jest taki sam dla warstw, a wartość p wynosiła 0,1424.
Odpowiedzi:
Pierwszy test pokazuje, że iloraz szans między A i B, ignorując C, różni się od 1. Spojrzenie na analizę warstwową pomaga zdecydować, czy dobrze jest zignorować C.
źródło