Zakładam, że „100% przetrwania” oznacza, że twoje strony zawierały tylko jeden organizm. 30 oznacza 30 organizmów, które umarły, a 31 oznacza 31 organizmów. Na tej podstawie chi-kwadrat powinien być w porządku, ale pokaże tylko, która hipoteza nie jest obsługiwana przez dane - nie powie ci, czy dwie rozsądne hipotezy są lepsze, czy nie. Przedstawiam analizę prawdopodobieństwa, która wyodrębnia te informacje - zgadza się z testem chi-kwadrat, ale daje więcej informacji niż test chi-kwadrat i lepszy sposób prezentacji wyników.
Model jest modelem Bernouli dla wskaźnika „śmierć”, ( oznacza komórkę tabeli , a oznacza pojedynczą jednostkę w obrębie komórka).Yij∼Bin(1,θij)i2×3j
Istnieją dwa globalne założenia leżące u podstaw testu chi-kwadrat:
- w danej komórce tabeli są równe, to znaczyθijθij=θik=θi
- są statystycznie niezależne, ponieważ . Oznacza to, że parametry prawdopodobieństwa mówią ci wszystko o - wszystkie inne informacje są nieistotne, jeśli wieszYijθiYijθi
Oznacz jako sumę , (więc ) i niech będzie rozmiarem grupy (więc ). Teraz mamy hipotezę do przetestowania:XiYijX1=30,X2=10,X3=1NiN1=61,N2=30,N3=11
HA:θ1=θ2,θ1=θ3,θ2=θ3
Ale jakie są alternatywy? Powiedziałbym, że inne możliwe kombinacje równe lub nierówne.
HB1:θ1≠θ2,θ1≠θ3,θ2=θ3
HB2:θ1≠θ2,θ1=θ3,θ2≠θ3
HB3:θ1=θ2,θ1≠θ3,θ2≠θ3
HC:θ1≠θ2,θ1≠θ3,θ2≠θ3
Jedna z tych hipotez musi być prawdziwa, biorąc pod uwagę powyższe „globalne” założenia. Należy jednak pamiętać, że żadna z nich nie określa konkretnych wartości stawek - dlatego należy je zintegrować. Biorąc pod uwagę, że jest prawdą, mamy tylko jeden parametr (ponieważ wszystkie są równe), a jednolity przełożony jest konserwatywnym wyborem, oznacz to i globalne założenia przez . więc mamy:HAI0
P(X1,X2,X3|N1,N2,N3,HA,I0)=∫10P(X1,X2,X3,θ|N1,N2,N3,HA,I0)dθ
=(N1X1)(N2X2)(N3X3)∫10θX1+X2+X3(1−θ)N1+N2+N3−X1−X2−X3dθ
=(N1X1)(N2X2)(N3X3)(N1+N2+N3+1)(N1+N2+N3X1+X2+X3)
Który jest rozkładem hipergeometrycznym podzielonym przez stałą. Podobnie dla będziemy mieli:
HB1
P(X1,X2,X3|N1,N2,N3,HB1,I0)=∫10P(X1,X2,X3,θ1θ2|N1,N2,N3,HB1,I0)dθ1dθ2
=(N2X2)(N3X3)(N1+1)(N2+N3+1)(N2+N3X2+X3)
Możesz zobaczyć wzór dla innych. Możemy obliczyć szanse dla powiedzmy , po prostu dzieląc powyższe dwa wyrażenia. Odpowiedź wynosi około , co oznacza, że dane obsługują ponad o około -krotny - dość słaby dowód na korzyść równych stawek. Inne prawdopodobieństwa podano poniżej.HAvsHB14HAHB14
Hypothesis(HA|D)(HB1|D)(HB2|D)(HB3|D)(HC|D)probability0.0189822650.0047906690.0516200220.4841558740.440451171
To pokazuje mocne dowody przeciwko równym stawkom, ale nie ma mocnych dowodów przemawiających za alternatywą defintie. Wydaje się, że istnieją mocne dowody na to, że stawka „offshore” różni się od pozostałych dwóch stawek, ale nie są jednoznaczne dowody na to, czy stawki „przybrzeżne” i „środkowe kanały” różnią się. Tego nie powie ci test chi-kwadrat - mówi tylko, że hipoteza jest „badziewiem”, ale nie jaką alternatywą postawić na jej miejsceA
Wierzę, że można użyć „równoczesnych przedziałów ufności” do robienia wielu porównań. Odniesieniem jest Agresti i in. 2008 Równoczesne przedziały ufności do porównywania parametrów dwumianowych. Biometria 64 1270-1275.
Odpowiedni kod R można znaleźć w http://www.stat.ufl.edu/~aa/cda/software.html
źródło