Test post-hoc dla testu dopasowania chi-kwadrat

16

Przeprowadzam test dobroci dopasowania chi-kwadrat (GOF) z trzema kategoriami i szczególnie chcę przetestować zero, że proporcje populacji w każdej kategorii są równe (tj. Proporcja wynosi 1/3 w każdej grupie):

                OBSERWOWANE DANE
Grupa 1     Grupa 2     Grupa 3     Ogółem
  686928 1012 2626

Zatem dla tego testu GOF oczekiwane liczby wynoszą 2626 (1/3) = 875,333, a test daje wysoce istotną wartość p <0,0001.

Teraz jest oczywiste, że Grupa 1 różni się znacznie od 2 i 3 i jest mało prawdopodobne, aby 2 i 3 były znacząco różne. Jeśli jednak chciałbym przetestować je wszystkie formalnie i móc podać wartość p dla każdego przypadku, jaka byłaby odpowiednia metoda?

Szukałem w Internecie i wydaje się, że są różne opinie, ale bez formalnej dokumentacji. Zastanawiam się, czy istnieje tekst lub recenzowana praca, która rozwiązuje ten problem.

Co wydaje mi się rozsądne jest, w świetle znacznego ogólnego testu, aby zrobić Z -tests na różnicę w każdej parze proporcjach, ewentualnie z korektą do wartości (może Bonferroniego, na przykład).α

Meg
źródło
Testy t nie byłyby odpowiednie. Możesz wykonać testy dopasowania pary (testy proporcji). Jakie różne opinie znalazłeś?
Glen_b
Przepraszam - miałem na myśli test Z (dla różnicy w dwóch proporcjach). Będę edytować.
Meg
Ten link mówi, aby zgrupować wszystkie inne grupy w porównaniu z tą, która jest przedmiotem zainteresowania (jest to dokładny test Fishera, ale ten link jest przekierowywany z innego linku o kwadracie chi, gdzie autor mówi, aby zastosować tę samą metodę do kwadratu chi jeśli chodzi o dokładność Fishera): biostathandbook.com/exactgof.html#posthoc Ale to nie jest tak naprawdę to, czego chcę - chcę parami, a nie jednej grupy przeciwko wszystkim innym.
Meg
1
Większość innych źródeł, które znajduję, mówi o ustawieniach tabeli awaryjnej, a nie o testach GOF.
Meg
Tak, możesz wykonać testy proporcji (czy to jako test z jedną próbką Z, test dwumianowy, czy test chi-kwadrat) dla każdego porównania parami. Nie musisz wykonywać porównań jeden na wszystkich.
Glen_b

Odpowiedzi:

8

Ku mojemu zdziwieniu, kilka wyszukiwań nie przyniosło wcześniejszej dyskusji post hoc o dobroć; Spodziewam się, że gdzieś tu jest, ale ponieważ nie mogę go łatwo zlokalizować, uważam, że rozsądne jest zamienić moje komentarze w odpowiedzi, aby ludzie mogli przynajmniej znaleźć ten przy użyciu tych samych wyszukiwanych terminów.

Porównania parami, które chcesz wykonać (pod warunkiem porównania tylko dwóch zaangażowanych grup) są rozsądne.

Sprowadza się to do pobierania par grup i testowania, czy proporcja w jednej z grup różni się od 1/2 (test proporcji jednej próby). To - jak sugerujesz - może być wykonane jako test Z (choć sprawdziłby się również test dwumianowy i dobroć chi-kwadrat).

Powinno tu działać wiele zwykłych podejść do radzenia sobie z ogólnym poziomem błędów typu I (w tym Bonferroni - wraz ze zwykłymi problemami, które mogą z tym wynikać).

Glen_b - Przywróć Monikę
źródło
Dziękujemy za radę i wysłanie odpowiedzi. Ja również byłem nieco zaskoczony, że ten problem najwyraźniej nie pojawił się w sprawie GOF.
Meg
1
Zaskoczyłem też, ponieważ ten problem nie jest omawiany. Wpadłem na to samo rozwiązanie co Glen, ale wciąż mam wątpliwości. Po pierwsze, każda para nie jest niezależna od próbki „globalnej”. Na przykład wyobraźmy sobie, że mamy 70, 16, 14, więc sugerujesz porównanie 16 i 14 z 15/15. Jednak w innych spostrzeżeniach może to być 72,144,14. tzn. źródło „wyższości” w parze nie może być odpowiednikiem w parze. Po drugie, czy powinniśmy zastosować pewne dostosowanie grupy, takie jak Bonferroni, jeśli wybory nie były faktycznie niezależne? Po trzecie, czy powinniśmy rozróżnić, czy wybór był wzajemnie wykluczający, czy to był wielokrotny wybór?
Niksr,
Ciekawe, czy można w tym celu zastosować test Q Cochrana z McNemarem post-hoc? Wydaje się, że wszystkie warunki tego testu są spełnione: 1) etap kontroli - równomierny rozkład 2) zdarzenie - reakcja na bodźce 3) jest to porównanie par (między hipotetycznym wyborem losowym a rzeczywistym wyborem) 4) zero - reakcja na bodziec różni się od losowej
Niksr
so you suggest compare 16 and 14 against 15/15@Niksr, no. Glen porównuje te dwie grupy jako 50/50procent. Trzecia grupa jest wykluczona z porównania.
ttnphns
Tak, miałem na myśli, że 16 i 14 to przypadki, a nie procenty.
Niksr
3

Mam ten sam problem (i cieszyłem się, że mogę znaleźć ten post). Teraz znalazłem też krótką notatkę na ten temat w Sheskin (2003: 225), którą chciałem się podzielić:

„Innym rodzajem porównania, które można przeprowadzić, jest zestawienie ze sobą tylko dwóch oryginalnych sześciu komórek. W szczególności załóżmy, że chcemy porównać Cell 1 / Monday z Cell 2 / Tuesday [...] Należy zauważyć, że w powyższy przykład, ponieważ stosujemy tylko dwie komórki, prawdopodobieństwo dla każdej komórki będzie wynosić π_i = 1/2. Oczekiwaną częstotliwość każdej komórki uzyskuje się mnożąc π_i = 1/2 przez całkowitą liczbę obserwacji w dwóch komórkach (co równa się 34). Jak zauważono wcześniej, przy przeprowadzaniu porównania takiego jak powyższy, krytycznym problemem, którym badacz musi się zająć, jest to, jaką wartość alfa zastosować w ocenie hipotezy zerowej. ”

Sheskin, DJ 2003. Podręcznik parametrycznych i nieparametrycznych procedur statystycznych: wydanie trzecie. CRC Press.

Karen
źródło