Który test do analizy krzyżowej: Boschloo czy Barnard?

11

Analizuję tabelę 2x2 z małego zestawu danych 30 pacjentów. Próbujemy retrospektywnie znaleźć pewne zmienne, które podpowiadają, jaki rodzaj leczenia wybrać. Zmienne (obs normalne / dziwne) i decyzja dotycząca leczenia (A / B) są szczególnie interesujące i dlatego dane wyglądają tak:

Obs/Tr. Dec.ABnormal121325strange055121830

Oczywiście w jednej komórce brakuje wpisów, co wyklucza test chi-kwadrat, a dokładny test Fishera nie daje nasycającej wartości p (ale nadal <10%). Więc moim pierwszym pomysłem było znalezienie testu o większej mocy i czytałem na blogu oraz w tym artykule o teście Barnarda i Boschloosa, że ​​ogólnie istnieją trzy scenariusze, które poddają się potężnemu testowi:

  1. Kolumna i Rowsums naprawiono dokładny test Fishera Fishera
  2. Kolumna lub (wyłącznie) Rowsums naprawione dokładny test Barnarda w prawo
  3. Żadne nie są naprawione dokładny test Boschloos w prawo

W powyższym artykule wskazano, że suma leczenia A i leczenia B prawie nigdy wcześniej nie była znana, dlatego możemy wykluczyć dokładny test Fishera. Ale co z innymi alternatywami? W przypadku kontroli, w której mamy zdrowe kontrole, możemy kontrolować grupę placebo i grupę Verum, które liczby możemy kontrolować, więc można by wybrać 2: Barnard. W moim przypadku nie jestem pewien, ponieważ z jednej strony mamy podobny problem matematyczny (suma poziomów obserwacji równoważna sumie placebo / verum), co prowadzi do Barnarda, ale konstrukcja jest inna, ponieważ nie możemy kontrolować nr. obserwacji normalnych / dziwnych przed pobraniem próbki, która prowadzi do 3: Boschloo.

Więc który test należy zastosować i dlaczego? Oczywiście, że chcę dużej mocy.

(Innym pytaniem, które chciałbym wiedzieć, jest to, że jeśli w przypadku chisq.testr nie byłoby lepiej użyć prop.test(x, alternative = "greater")? Teoretyczne aspekty są wyjaśnione tutaj .)

Taz
źródło
Czy zadałbyś to pytanie, czy test Fishera dałby wartość ap poniżej twojego poziomu istotności?
Michael M
Ponieważ kolumny są naprawione (wygląda na to, że twój artykuł sugeruje Barnarda), ale nie mogłem się do tego dostać bez płacenia :(
MikeP
@Michael: Myślę, że ogólnie jest to istotny problem, ale bez tego konkretnego problemu nie zastanowiłbym się nad głębszymi badaniami.
Taz
@Mike: Sry, byłem w instytucie i nie myślałem o paywall. Jeśli znajdę bezpłatne rozwiązanie, dodam je. Myślę jednak, że nie wskazałem wystarczająco jasno problemu. W moim przypadku grupy terapeutyczne nie są kontrolowane, lecz są konsekwencją ręcznej diagnozy przez lekarza i chcę się dowiedzieć, czy decyzja o leczeniu A lub B jest powiązana ze zmienną obserwacji. A także, który test zastosować i jak go optymalnie zastosować.
Taz
Ahhh, więc osoba wchodząca do badania mogła do końca skończyć w którejkolwiek z czterech kategorii?
MikeP

Odpowiedzi:

13

Mogą istnieć pewne nieporozumienia dotyczące terminu „test Barnarda” lub test „Boschloo”. Dokładny test Barnarda jest testem bezwarunkowym w tym sensie, że nie warunkuje on obu marginesów. Dlatego zarówno druga, jak i trzecia kula są testem Barnarda. Zamiast tego powinniśmy napisać:

  1. Oba marginesy stałe (Distgegeometryczny) → dokładny test Fishera
  2. Naprawiono jeden margines (Double Binomial Dist'n) → dokładny test Barnarda
  3. Brak ustalonych marginesów (Wielomian Dist'n) → dokładny test Barnarda

Dokładny test Barnarda obejmuje dwa typy tabel, więc rozróżniamy je, mówiąc odpowiednio model „dwumianowy” lub „wielomianowy”.

Zazwyczaj dokładny test Barnarda albo używa statystyki puli Z (zwanej też wynikiem), aby określić tabele „jak lub bardziej ekstremalne”. Zwróć uwagę, że oryginalny papier Barnarda (1947) stosuje bardziej skomplikowane podejście do określania bardziej ekstremalnych tabel (zwanych „CSM”). Dokładny test Boschloo wykorzystuje wartość p Fishera do ustalenia tabel „jak lub bardziej ekstremalnych”. Test Boschloo jest bardziej wydajny niż dokładny test Fishera.

W przypadku twojego zestawu danych wygląda na to, że żaden z marginesów nie został naprawiony, dlatego zalecamy użycie dokładnego testu Boschloo z modelem wielomianowym. Test Boschloo był nieco lepszy dla niewyważonych wskaźników marginesów (choć zwykle bardzo podobny do dokładnego testu Barnarda ze statystyką z puli Z). Ponieważ jednak zarówno model testowy, jak i model wielomianowy Boschlo są znacznie bardziej wymagające obliczeniowo, możesz również użyć modelu dwumianowego (uzasadnienie, dlaczego byłoby to nadal właściwe, jest nieco skomplikowane; krótko mówiąc, marginesy są w przybliżeniu statystyczną wartością pomocniczą, więc można uzależnić od marginesu). Aby uzyskać więcej informacji na temat dokładnych testów i informacji dotyczących implementacji, skorzystaj z pakietu Exact R ( https://cran.r-project.org/web/packages/Exact/Exact.pdf). Jestem autorem pakietu i jest to bardziej zaktualizowana wersja kodu na blogu.

Peter Calhoun
źródło
1
Dzięki za jasne oświadczenie! Bardzo miło jest mieć to wyjaśnienie w kilku wierszach. W końcu zrobiłem to tak, jak napisałeś po przeczytaniu gazety, która jest bardzo dobra, ale także bardzo długa ;-)
Taz