Dlaczego iloraz szans z formuły i testu rybaka R. różnią się? Który wybrać?

14

W poniższym przykładzie

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

Obliczam iloraz szans (nr 1) „ręcznie”, 0,600; następnie (# 2) jako jeden z wyników dokładnego testu Fishera, 0,616.

Dlaczego nie dostałem tej samej wartości?

Dlaczego istnieje kilka sposobów obliczania ilorazu szans i jak wybrać najbardziej odpowiedni?

winerd
źródło

Odpowiedzi:

10

Ze strony pomocy dla fisher.test():

Należy zauważyć, że stosowana jest warunkowa ocena maksymalnego prawdopodobieństwa (MLE) zamiast bezwarunkowego MLE (przykładowy iloraz szans).

zx8754
źródło
3

Aby dodać do dyskusji tutaj, warto zapytać, na czym dokładnie polega to „warunkowe” prawdopodobieństwo. Test Fishera różni się od innych analiz kategorycznych tym, że bierze pod uwagę wszystkie marginesy tabeli, podczas gdy model regresji logistycznej (i odpowiadający mu test chi-kwadrat Pearsona, który jest testem punktowym modelu logistycznego) uwzględnia tylko jeden margines .

Test Fishera uwzględnia następnie rozkład hipergeometryczny jako model prawdopodobieństwa dla zliczeń obserwowanych w każdej z 4 komórek. Rozkład hipergeometryczny ma tę właściwość, że ponieważ rozkład wyjściowego ilorazu szans nie jest ciągły, często uzyskuje się inną OR jako oszacowanie maksymalnego prawdopodobieństwa.

AdamO
źródło
2
Nie sądzę, aby twoja odpowiedź wyjaśniała, w jaki sposób może powstać to szczególne prawdopodobieństwo. Jeśli modelujesz proces generowania danych za pomocą dwumianu produktu, powiedzmy, otrzymujesz inne prawdopodobieństwo (i MLE) zależne od wartości krańcowych, od tego, co otrzymujesz, jeśli modelujesz je z niecentralnym rozkładem hipergeometrycznym Walleniusa - marginalnym sumy są „uważane za stałe” w obu przypadkach.
Scortchi - Przywróć Monikę
1

Aby odpowiedzieć na twoje drugie pytanie, biostaty nie są moją mocną stroną, ale uważam, że powodem wielu statystyk ilorazu szans jest uwzględnienie projektu próbkowania i projektu eksperymentów.

Znalazłem tutaj trzy referencje, które pozwolą ci zrozumieć, dlaczego istnieje różnica między warunkowym MLE a bezwarunkowym ilorazem szans, a także innymi typami.

  1. Estymacja punktowa i przedziałowa wspólnego ilorazu szans w kombinacji tabel 2 × 2 ze stałymi marginesami

  2. Wpływ błędu systematycznego na estymatory ryzyka względnego dla próbek dopasowanych parami i warstwowych

  3. Badanie porównawcze szacowania warunkowego maksymalnego prawdopodobieństwa wspólnego ilorazu szans

Jon
źródło
3
Przydatne byłoby podsumowanie choć trochę tego, co mają do powiedzenia te odniesienia.
Scortchi - Przywróć Monikę
@Scortchi, zgodził się. Byłem zajęty pracą i miałem tylko okazję przeczytać pierwszą lub dwie strony. Dodam podsumowanie każdego w ten weekend.
Jon
@Jon Gdybyś mógł, przydatne byłoby dodanie tego krótkiego podsumowania
Glen_b -Reinstate Monica
@ Jon Zadałem tylko jedno pytanie. To bliźniak dodał drugie pytanie 4 lata po tym, jak opublikowałem swoje oryginalne pytanie. Nie cofam irytującej edycji bliźniaka, gdy odniosłeś się do drugiego pytania, ale nie jestem pewien, jak przyjąć odpowiedź.
winerd