TŁO: Pomiń bezpiecznie - jest tutaj w celach informacyjnych i uzasadnia pytanie.
Otwarcie tego artykułu brzmi:
„Słynny test przygodności chi-kwadrat Karla Pearsona pochodzi z innej statystyki, zwanej statystyką z, opartej na rozkładzie normalnym. Najprostsze wersje mogą być matematycznie identyczne z równoważnymi testami z. Testy dają taki sam wynik we wszystkich okolicznościach. Dla wszystkich celów i celów „chi-kwadrat” można by nazwać „z-kwadrat”. Wartości krytyczne dla jednego stopnia swobody są kwadratem odpowiednich wartości krytycznych z. ”
Zostało to wielokrotnie potwierdzone w CV ( tutaj , tutaj , tutaj i innych).
I rzeczywiście możemy udowodnić, że jest równoważne z :
Powiedzmy, że i że i znajdź gęstość za pomocą metody :
. Problem polega na tym, że nie możemy zintegrować w ścisłej postaci gęstości rozkładu normalnego. Ale możemy to wyrazić:
Ponieważ wartości normalnego są symetryczne:
pdfxpdf√ . Zrównanie tego z normalnego (teraz w będzie aby być podłączonym do części normalnego ); i pamiętając o dołączeniu na końcu : e - x 2 pdf1
Porównaj z pdf kwadratu chi:
Ponieważ , dla df uzyskaliśmy dokładnie kwadratu chi. 1pdf
Ponadto, jeśli wywołamy funkcję prop.test()
w R , wywołujemy ten sam test jak gdybyśmy zdecydowali .chisq.test()
PYTANIE:
Dostaję więc wszystkie te punkty, ale wciąż nie wiem, jak odnoszą się one do faktycznej implementacji tych dwóch testów z dwóch powodów:
Test Z nie jest podniesiony do kwadratu.
Rzeczywiste statystyki testów są zupełnie inne:
Wartość statystyki testowej dla wynosi:
gdzie
= skumulowana statystyka testu Pearsona, która asymptotycznie zbliża się do . = liczba obserwacji typu ; = całkowita liczba obserwacji; = = oczekiwana (teoretyczna) częstotliwość typu , potwierdzona hipotezą zerową, że ułamek typu w populacji wynosi ; = liczba komórek w tabeli.
Z drugiej strony statystyka testu dla testu wynosi:
z , gdzie i to liczba „sukcesów” w stosunku do liczby przedmiotów na każdym z poziomów kategorii zmienne, tj. i .
Ta formuła wydaje się opierać na rozkładzie dwumianowym.
Te dwie statystyki testów są wyraźnie różne i dają różne wyniki dla faktycznych statystyk testu, a także dla wartości p : 5.8481
dla i dla testu z, gdzie ( dziękuję, @ mark999). Wartość p dla wynosi , podczas gdy dla testu z jest . Różnica wyjaśniona przez dwustronne versus jednostronne: (dziękuję @amoeba).2.4183
0.01559
0.0077
Więc na jakim poziomie mówimy, że są jednym i tym samym?
źródło
chisq.test()
, próbowałeś używaćcorrect=FALSE
?Odpowiedzi:
Miejmy tabelę częstotliwości 2x2, w której kolumny to dwie grupy respondentów, a wiersze to dwie odpowiedzi „Tak” i „Nie”. I zamieniliśmy częstotliwości na proporcje w grupie, tj. Na profile pionowe :
Zwykły (nie poprawiony przez Yatesa) tej tabeli, po zastąpieniu proporcji zamiast częstotliwości w jej formule, wygląda następująco:χ2
Pamiętaj, że , element średniej ważonej profilu dwóch profili i , i podłącz go do formuły, aby uzyskaćp=n1p1+n2p2n1+n2
(p1,q1)
(p2,q2)
Podziel zarówno licznik, jak i mianownik przez(n21n2+n1n22) i uzyskaj
kwadratowa statystyka Z testu Z proporcji dla odpowiedzi „Tak”.
Więc
2x2
jednorodność statystyki chi-kwadrat (i test) jest równoważna testowi z dwóch proporcji. Tak zwane częstotliwości oczekiwane obliczone w teście chi-kwadrat w danej kolumnie to ważony (przez grupęn
) średni profil pionowy (tj. Profil „grupy średniej”) pomnożony przez profil tej grupyn
. Okazuje się zatem, że chi-kwadrat testuje odchylenie każdego z dwóch profili grup od tego średniego profilu grupowego, co jest równoważne testowaniu różnic między profilami grup, co jest testem z proporcji.Jest to jedna demonstracja powiązania między miarą asocjacji zmiennych (chi-kwadrat) a miarą różnicy w grupie (statystyka testu z). Powiązania atrybutów i różnice grup są (często) dwoma aspektami tego samego.
(Pokazuje rozwinięcie w pierwszym wierszu powyżej, prośba @ Antoni):
źródło