Analizuję tabelę 2x2 z małego zestawu danych 30 pacjentów. Próbujemy retrospektywnie znaleźć pewne zmienne, które podpowiadają, jaki rodzaj leczenia wybrać. Zmienne (obs normalne / dziwne) i decyzja dotycząca leczenia (A / B) są szczególnie interesujące i dlatego dane wyglądają tak:
Oczywiście w jednej komórce brakuje wpisów, co wyklucza test chi-kwadrat, a dokładny test Fishera nie daje nasycającej wartości p (ale nadal <10%). Więc moim pierwszym pomysłem było znalezienie testu o większej mocy i czytałem na blogu oraz w tym artykule o teście Barnarda i Boschloosa, że ogólnie istnieją trzy scenariusze, które poddają się potężnemu testowi:
- Kolumna i Rowsums naprawiono dokładny test Fishera Fishera
- Kolumna lub (wyłącznie) Rowsums naprawione dokładny test Barnarda w prawo
- Żadne nie są naprawione dokładny test Boschloos w prawo
W powyższym artykule wskazano, że suma leczenia A i leczenia B prawie nigdy wcześniej nie była znana, dlatego możemy wykluczyć dokładny test Fishera. Ale co z innymi alternatywami? W przypadku kontroli, w której mamy zdrowe kontrole, możemy kontrolować grupę placebo i grupę Verum, które liczby możemy kontrolować, więc można by wybrać 2: Barnard. W moim przypadku nie jestem pewien, ponieważ z jednej strony mamy podobny problem matematyczny (suma poziomów obserwacji równoważna sumie placebo / verum), co prowadzi do Barnarda, ale konstrukcja jest inna, ponieważ nie możemy kontrolować nr. obserwacji normalnych / dziwnych przed pobraniem próbki, która prowadzi do 3: Boschloo.
Więc który test należy zastosować i dlaczego? Oczywiście, że chcę dużej mocy.
(Innym pytaniem, które chciałbym wiedzieć, jest to, że jeśli w przypadku chisq.test
r nie byłoby lepiej użyć prop.test(x, alternative = "greater")
? Teoretyczne aspekty są wyjaśnione tutaj .)
Odpowiedzi:
Mogą istnieć pewne nieporozumienia dotyczące terminu „test Barnarda” lub test „Boschloo”. Dokładny test Barnarda jest testem bezwarunkowym w tym sensie, że nie warunkuje on obu marginesów. Dlatego zarówno druga, jak i trzecia kula są testem Barnarda. Zamiast tego powinniśmy napisać:
Dokładny test Barnarda obejmuje dwa typy tabel, więc rozróżniamy je, mówiąc odpowiednio model „dwumianowy” lub „wielomianowy”.
Zazwyczaj dokładny test Barnarda albo używa statystyki puli Z (zwanej też wynikiem), aby określić tabele „jak lub bardziej ekstremalne”. Zwróć uwagę, że oryginalny papier Barnarda (1947) stosuje bardziej skomplikowane podejście do określania bardziej ekstremalnych tabel (zwanych „CSM”). Dokładny test Boschloo wykorzystuje wartość p Fishera do ustalenia tabel „jak lub bardziej ekstremalnych”. Test Boschloo jest bardziej wydajny niż dokładny test Fishera.
W przypadku twojego zestawu danych wygląda na to, że żaden z marginesów nie został naprawiony, dlatego zalecamy użycie dokładnego testu Boschloo z modelem wielomianowym. Test Boschloo był nieco lepszy dla niewyważonych wskaźników marginesów (choć zwykle bardzo podobny do dokładnego testu Barnarda ze statystyką z puli Z). Ponieważ jednak zarówno model testowy, jak i model wielomianowy Boschlo są znacznie bardziej wymagające obliczeniowo, możesz również użyć modelu dwumianowego (uzasadnienie, dlaczego byłoby to nadal właściwe, jest nieco skomplikowane; krótko mówiąc, marginesy są w przybliżeniu statystyczną wartością pomocniczą, więc można uzależnić od marginesu). Aby uzyskać więcej informacji na temat dokładnych testów i informacji dotyczących implementacji, skorzystaj z pakietu Exact R ( https://cran.r-project.org/web/packages/Exact/Exact.pdf). Jestem autorem pakietu i jest to bardziej zaktualizowana wersja kodu na blogu.
źródło