Próbuję znaleźć rozwiązanie, aby porównać dwa testy „dobroci dopasowania chi-kwadrat”. Dokładniej, chcę porównać wyniki z dwóch niezależnych eksperymentów. W tych eksperymentach autorzy wykorzystali chi-kwadrat dobroci dopasowania, aby porównać losowe zgadywanie (częstotliwości oczekiwane) z częstotliwościami obserwowanymi. Dwa eksperymenty otrzymały taką samą liczbę uczestników, a procedury eksperymentalne są identyczne, zmieniono tylko bodźce. Wyniki dwóch eksperymentów wykazały znaczący chi-kwadrat (exp. 1: X² (18) = 45; p <.0005 i exp. 2: X² (18) = 79; p <.0001).
Teraz chcę przetestować, czy istnieje różnica między tymi dwoma wynikami. Myślę, że rozwiązaniem może być zastosowanie przedziałów ufności, ale nie wiem, jak obliczyć te przedziały ufności tylko z tymi wynikami. A może test do porównania wielkości efektu (w Cohena)?
Czy ktoś ma rozwiązanie?
Wielkie dzięki!
FD
źródło
Odpowiedzi:
Bardzo ograniczone informacje, które posiadasz, są z pewnością poważnym ograniczeniem! Jednak rzeczy nie są całkowicie beznadziejne.
Przy tych samych założeniach, które prowadzą do asymptotycznego rozkładu dla statystyki testowej testu dobroci dopasowania o tej samej nazwie, statystyka testowa według alternatywnej hipotezy ma asymptotycznie niecentralny rozkład χ 2 . Jeśli założymy, że dwa bodźce są a) znaczące i b) mają ten sam efekt, powiązane statystyki testowe będą miały taki sam asymptotyczny niecentralny rozkład χ 2 . Możemy to wykorzystać do skonstruowania testu - zasadniczo poprzez oszacowanie parametrów noncentrality X i sprawdzając, czy statystyki testowe są daleko w ogonach w noncentral × 2 ( 18 , λ )χ2) χ2) χ2) λ χ2)( 18 , λ^) dystrybucja. (Nie oznacza to jednak, że ten test będzie miał dużą moc.)
Możemy oszacować parametr niecentralności, biorąc pod uwagę dwie statystyki testowe, biorąc ich średnią i odejmując stopnie swobody (metoda estymatora momentów), dając oszacowanie 44, lub przez maksymalne prawdopodobieństwo:
Dobra zgodność między naszymi dwoma szacunkami, nic dziwnego, biorąc pod uwagę dwa punkty danych i 18 stopni swobody. Teraz obliczyć wartość p:
Zatem nasza wartość p wynosi 0,12, co nie wystarcza do odrzucenia hipotezy zerowej, że oba bodźce są takie same.
co daje:
Patrząc na prawdziwe punkty hipotezy zerowej (wartość na osi x = 0), widzimy, że test jest konserwatywny, ponieważ nie wydaje się odrzucać tak często, jak wskazuje poziom, ale nie w przeważającej mierze. Tak jak się spodziewaliśmy, nie ma dużej mocy, ale jest lepszy niż nic. Zastanawiam się, czy istnieją lepsze testy, biorąc pod uwagę bardzo ograniczoną ilość dostępnych informacji.
źródło
Można uzyskać V Cramera, który można interpretować jako korelację, przekonwertować go na Z. Fishera, a następnie przedział ufności jest prosty (SE = 1 / sqrt (n-3): Z ± se * 1,96). Po uzyskaniu końcówek CI możesz przekonwertować je z powrotem na r.
Czy zastanawiałeś się nad umieszczeniem wszystkich swoich wyników w tabeli awaryjnej z dalszym wymiarem eksperymentu?
źródło