W swojej pracy widziałem kilka zastosowań dokładnego testu Fishera i zastanawiałem się, jak dobrze pasuje do moich danych. Patrząc na kilka źródeł, rozumiałem, jak obliczyć statystyki, ale nigdy nie widziałem jasnego i formalnego wyjaśnienia przyjętej hipotezy zerowej.
Czy ktoś może mi wyjaśnić lub odesłać mnie do formalnego wyjaśnienia zakładanego podziału? Będzie wdzięczny za wyjaśnienie wartości w tabeli awaryjnej.
Odpowiedzi:
W przypadku założenie dystrybucyjne podaje dwie niezależne dwumianowe zmienne losowe X 1 ∼ B i n ( n 1 , θ 1 ) i X 2 ∼ B i n ( n 2 , θ 2 ) . Hipotezą zerową jest równość θ 1 = θ 2 . Ale dokładny test Fishera jest testem warunkowym: opiera się na rozkładzie warunkowym X 1, biorąc pod uwagę X 12×2 X1∼Bin(n1,θ1) X2∼Bin(n2,θ2) θ1=θ2 X1 . Ten rozkład jest rozkładem hipergeometrycznym z jednym nieznanym parametrem: iloraz szans ψ = θ 1X1+X2 , a następnie hipoteza zerowa wynosiψ=1.ψ=θ11−θ1θ21−θ2 ψ=1
Ta dystrybucja ma swoją stronę w Wikipedii .
Aby ocenić to za pomocą R, możesz po prostu użyć wzoru określającego prawdopodobieństwo warunkowe:
Lub użyj
dnoncenhypergeom
funkcjiMCMCpack
pakietu:źródło
Tak zwany „dokładny” test Fishera sprawia, że ten sam rodzaj subtelne założeń, które testy zrobić.χ2)
źródło