Alternatywy dla testu chi-kwadrat dla niezależności dla tabel większych niż 2 x 2

9

Jakie są alternatywy dla testu chi-kwadrat dla zmiennych kategorialnych z tabelami większymi niż 2 x 2 i komórkami o liczbie mniejszej niż 5, jeśli nie chcę scalać klas?

Izrael
źródło
2
Test chi-kwadrat może być również stosowany z większymi tabelami niż 2x2. Czy możesz wyjaśnić, dlaczego test chi-kwadrat nie powinien być odpowiedni dla twojego problemu? Ponadto, czy możesz podać problem, który chcesz rozwiązać?
COOLSerdash
Mam tabelę zdarzeń awaryjnych 2 x 3 i komórki z liczbą mniejszą niż 5
Izrael
2
Dziękujemy, edytuj pytanie i dodaj tę informację, ponieważ nie wszyscy czytają komentarze. Zwykłą ogólną zasadą dotyczącą testu chi-kwadrat jest to, że jego wyniki mogą być niedokładne, jeśli oczekiwana liczba komórek jest niższa niż 5. Zwykle w takich przypadkach zaleca się test Fishera . Test Barnarda może być również opcją.
COOLSerdash

Odpowiedzi:

15

Istnieją tutaj pewne powszechne nieporozumienia. Test chi-kwadrat doskonale nadaje się do stosowania z tabelami większymi niż . Aby rzeczywisty rozkład statystyki testu chi-kwadrat był zbliżony do rozkładu chi-kwadrat, tradycyjnym zaleceniem jest, aby wszystkie komórki miały oczekiwane wartości . Należy zwrócić uwagę na dwie rzeczy: 2)×2)5

  1. Nie ma znaczenia, jakie są obserwowane liczby komórek - mogą być bez problemu - liczą się tylko oczekiwane liczby . 0

  2. Ta tradycyjna zasada jest obecnie zbyt konserwatywna. Może być dobrze mieć komórek z oczekiwaną liczbą o ile żadna spodziewana liczba nie jest . Widzieć: 20%<5<1

Jeśli oczekiwane liczby nie spełniają tego dokładniejszego kryterium, dostępne są alternatywne opcje:

  1. Najlepszym rozwiązaniem jest prawdopodobnie symulacja rozkładu próbkowania statystyki testowej lub użycie testu permutacji. Na przykład w R można po prostu ustawić chisq.test(..., simulate.p.value=TRUE). Inne oprogramowanie również powinno to umożliwić.

  2. Możesz użyć alternatywnego testu, takiego jak dokładny test Fishera. Chociaż dokładny test Fishera jest często zalecany w tej sytuacji, warto zauważyć, że przyjmuje on różne założenia i może nie być odpowiedni. Mianowicie, dokładny test Fishera zakłada, że ​​liczby wierszy i kolumn zostały ustalone z góry i tylko układ kombinacji rzędów x kolumn może się różnić (patrz: Biorąc pod uwagę moc komputerów w dzisiejszych czasach, czy kiedykolwiek istnieje powód, aby wykonać test chi-kwadrat zamiast dokładnego testu Fishera? ). Jeśli nie masz pewności co do tego założenia, lepszym rozwiązaniem będzie symulowanie chi-kwadrat.

gung - Przywróć Monikę
źródło