Przeprowadzam test dobroci dopasowania chi-kwadrat (GOF) z trzema kategoriami i szczególnie chcę przetestować zero, że proporcje populacji w każdej kategorii są równe (tj. Proporcja wynosi 1/3 w każdej grupie):
OBSERWOWANE DANE
Grupa 1 Grupa 2 Grupa 3 Ogółem
686928 1012 2626
Zatem dla tego testu GOF oczekiwane liczby wynoszą 2626 (1/3) = 875,333, a test daje wysoce istotną wartość p <0,0001.
Teraz jest oczywiste, że Grupa 1 różni się znacznie od 2 i 3 i jest mało prawdopodobne, aby 2 i 3 były znacząco różne. Jeśli jednak chciałbym przetestować je wszystkie formalnie i móc podać wartość p dla każdego przypadku, jaka byłaby odpowiednia metoda?
Szukałem w Internecie i wydaje się, że są różne opinie, ale bez formalnej dokumentacji. Zastanawiam się, czy istnieje tekst lub recenzowana praca, która rozwiązuje ten problem.
Co wydaje mi się rozsądne jest, w świetle znacznego ogólnego testu, aby zrobić Z -tests na różnicę w każdej parze proporcjach, ewentualnie z korektą do wartości (może Bonferroniego, na przykład).
Odpowiedzi:
Ku mojemu zdziwieniu, kilka wyszukiwań nie przyniosło wcześniejszej dyskusji post hoc o dobroć; Spodziewam się, że gdzieś tu jest, ale ponieważ nie mogę go łatwo zlokalizować, uważam, że rozsądne jest zamienić moje komentarze w odpowiedzi, aby ludzie mogli przynajmniej znaleźć ten przy użyciu tych samych wyszukiwanych terminów.
Porównania parami, które chcesz wykonać (pod warunkiem porównania tylko dwóch zaangażowanych grup) są rozsądne.
Sprowadza się to do pobierania par grup i testowania, czy proporcja w jednej z grup różni się od 1/2 (test proporcji jednej próby). To - jak sugerujesz - może być wykonane jako test Z (choć sprawdziłby się również test dwumianowy i dobroć chi-kwadrat).
Powinno tu działać wiele zwykłych podejść do radzenia sobie z ogólnym poziomem błędów typu I (w tym Bonferroni - wraz ze zwykłymi problemami, które mogą z tym wynikać).
źródło
so you suggest compare 16 and 14 against 15/15
@Niksr, no. Glen porównuje te dwie grupy jako50/50
procent. Trzecia grupa jest wykluczona z porównania.Mam ten sam problem (i cieszyłem się, że mogę znaleźć ten post). Teraz znalazłem też krótką notatkę na ten temat w Sheskin (2003: 225), którą chciałem się podzielić:
„Innym rodzajem porównania, które można przeprowadzić, jest zestawienie ze sobą tylko dwóch oryginalnych sześciu komórek. W szczególności załóżmy, że chcemy porównać Cell 1 / Monday z Cell 2 / Tuesday [...] Należy zauważyć, że w powyższy przykład, ponieważ stosujemy tylko dwie komórki, prawdopodobieństwo dla każdej komórki będzie wynosić π_i = 1/2. Oczekiwaną częstotliwość każdej komórki uzyskuje się mnożąc π_i = 1/2 przez całkowitą liczbę obserwacji w dwóch komórkach (co równa się 34). Jak zauważono wcześniej, przy przeprowadzaniu porównania takiego jak powyższy, krytycznym problemem, którym badacz musi się zająć, jest to, jaką wartość alfa zastosować w ocenie hipotezy zerowej. ”
Sheskin, DJ 2003. Podręcznik parametrycznych i nieparametrycznych procedur statystycznych: wydanie trzecie. CRC Press.
źródło