Porównuję dwie grupy mutantów, z których każda może mieć tylko jeden z 21 różnych fenotypów. Chciałbym zobaczyć, czy rozkład tych wyników jest podobny między dwiema grupami. Znalazłem test online, który oblicza „test chi-kwadrat dla równości rozkładów” i daje pewne wiarygodne wyniki. Mam jednak kilka zer w tej tabeli, więc czy w ogóle mogę w tym przypadku użyć chi-kwadrat?
Oto tabela z dwiema grupami i liczbą poszczególnych fenotypów:
2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1
Odpowiedzi:
W dzisiejszych czasach doskonale możliwe jest wykonanie „dokładnego” testu Fishera na takim stole. Właśnie otrzymałem p = 0,087 przy użyciu Staty (
tabi 2 1 \ 2 3 \ .... , exact
. Wykonanie zajęło 0,19 sekundy).EDYCJA po komentarzu chl poniżej (próbowałem dodać jako komentarz, ale nie można sformatować):
Działa dla mnie w wersji 2.12.0, chociaż musiałem zwiększyć opcję „obszaru roboczego” ponad jej domyślną wartość 200000:
(Czas wykonania jest nieco szybszy niż w Stacie, ale ma to wątpliwe znaczenie, biorąc pod uwagę czas poświęcony na zrozumienie komunikatu o błędzie, który używa „obszaru roboczego” w znaczeniu innego niż zwykłe znaczenie R, pomimo faktu, że fisher.test jest częścią podstawowego pakietu „statystyk” R.)
źródło
Zazwyczaj wytyczne przewidują, że oczekiwane liczby powinny być większe niż 5, ale można je nieco rozluźnić, jak omówiono w następującym artykule:
Zobacz także stronę domową Iana Campbella .
chisq.test(..., sim=TRUE)
W twoim przypadku wydaje się, że około 80% oczekiwanych liczb jest poniżej 5, a 40% poniżej 1. Czy sensowne byłoby agregowanie niektórych zaobserwowanych fenotypów?
źródło