Test Fishera w R.

11

Załóżmy, że mamy następujący zestaw danych:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Jeśli uruchomię dokładny test Fishera w R, co to oznacza alternative = greater(lub mniej)? Na przykład:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Dostaję p-value = 0.01588i odds ratio = 3.943534. Ponadto, kiedy odwracam wiersze tabeli awaryjnej w następujący sposób:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

wtedy dostaję p-value = 0.9967i odds ratio = 0.2535796. Ale kiedy uruchamiam dwie tabele nieprzewidziane bez alternatywnego argumentu (tj. fisher.test(mat)), Wtedy otrzymuję p-value = 0.02063.

  1. Czy możesz mi wyjaśnić powód?
  2. Czym jest hipoteza zerowa i hipoteza alternatywna w powyższych przypadkach?
  3. Czy mogę uruchomić test Fishera na tabeli awaryjnej:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: Nie jestem statystykiem. Próbuję nauczyć się statystyki, aby Twoja pomoc (odpowiedzi w prostym języku angielskim) była bardzo mile widziana.

Snape
źródło

Odpowiedzi:

11

greater(lub less) odnosi się do jednostronnego testu porównującego hipotezę zerową p1=p2z alternatywą p1>p2(lub p1<p2). Natomiast dwustronny test porównuje hipotezę zerową z alternatywą, która p1nie jest równa p2.

Dla twojego stołu odsetek dietetyków będących mężczyznami wynosi 1/4 = 0,25 (10 na 40) w twojej próbie. Z drugiej strony odsetek nie-dietetycznych mężczyzn to 1/13 lub (5 z 65) równy 0,077 w próbce. Zatem oszacowanie dla p1wynosi 0,25, a dla p20,077. Dlatego wydaje się, że p1>p2.

Dlatego dla jednostronnej alternatywy p1>p2wartość p wynosi 0,01588. (Małe wartości p wskazują, że hipoteza zerowa jest mało prawdopodobna, a alternatywa jest prawdopodobna).

Gdy alternatywą jest p1<p2, widzimy, że twoje dane wskazują, że różnica jest w złym (lub nieprzewidzianym) kierunku.

Dlatego w tym przypadku wartość p jest tak wysoka 0,9967. W przypadku dwustronnej alternatywy wartość p powinna być nieco wyższa niż w przypadku dwustronnej alternatywy p1>p2. I rzeczywiście ma wartość p równą 0,02063.

Michael R. Chernick
źródło
1
Fantastyczne wyjaśnienie. Tak więc dokładny test Fishera faktycznie porównuje prawdopodobieństwa między rzędami w przeciwieństwie do kolumn?
Christian
@Christian: Nie, nie ma znaczenia, czy jego wiersze czy kolumny podczas testu Fishera sprawdzają korelację w tabeli awaryjnej. Wiersze i kolumny nie mają bezpośredniego znaczenia. Możesz także przeformułować hipotezę: zamiast H0 „ludzie, którzy palą, umierają młodsi”, możesz również założyć H0: „ludzie, którzy umierają młodsi, częściej palą”. Wyniki testu Fishera powiedzą ci, czy jakiekolwiek zaobserwowane połączenie w danych obsługuje hipotezę zerową, czy nie, ale nie ma znaczenia, która zmienna niezależna lub zależna, a także wybór wierszy / kolumn nie ma znaczenia: )
Dominique Paul