Pytanie początkującego o resztki Pearsona w kontekście testu chi-kwadrat na dobroć dopasowania:
Oprócz statystyki testowej chisq.test
funkcja R zgłasza resztkową wartość Pearsona:
(obs - exp) / sqrt(exp)
Rozumiem, dlaczego przyglądanie się różnicy między wartościami obserwowanymi i oczekiwanymi nie jest tak pouczające, ponieważ mniejsza próbka spowoduje mniejszą różnicę. Chciałbym jednak dowiedzieć się więcej o działaniu mianownika: po co dzielić przez pierwiastek oczekiwanej wartości? Czy jest to „znormalizowana” pozostałość?
chi-squared
goodness-of-fit
residuals
Iain Dillingham
źródło
źródło
stdres
znormalizowanych pozostałości.chisq.test
również obliczastdres
składnik?Odpowiedzi:
Standardowy model statystyczny leżący u podstaw analizy tabel kontyngencji zakłada, że (bezwarunkowo od liczby całkowitej) liczby komórek są niezależnymi zmiennymi losowymi Poissona. Więc jeśli maszn×m
Tak więc to, o co pytasz w formule, o którą pytasz, to znormalizowana liczba komórek, przy założeniu, że liczba komórek ma (bezwarunkowy) rozkład Poissona.
Z tego miejsca często testuje się niezależność zmiennych wierszy i kolumn w danych, w tym przypadku można użyć statystyki testowej, która sprawdza sumę kwadratów powyższych wartości (która jest równoważna normie do kwadratu) wektora znormalizowanych wartości). Test chi-kwadrat zapewnia wartość p dla tego rodzaju testu opartą na aproksymacji dużej próbki do rozkładu zerowego statystyki testu. Zwykle stosuje się go w przypadkach, gdy żadna z wartości sprzedaży nie jest zbyt mała.
źródło
W kontekście dobroci dopasowania możesz zapoznać się z tym http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm .
Jeśli chcesz wiedzieć, jak się tam dostał mianownik, będziesz musiał zobaczyć chi-kwadrat tutaj jako normalne przybliżenie dwumianu, na początek, który następnie można rozszerzyć na wielomian.
źródło