Jak działa test chi-kwadrat Pearsona

18

Po ostatnim głosowaniu w dół próbowałem sprawdzić swoje zrozumienie testu Pearson Chi Squared. Zwykle używam statystyki chi kwadrat (lub zredukowanej statystyki chi kwadrat) do dopasowania lub sprawdzenia wynikowego dopasowania. W tym przypadku wariancja nie jest zwykle oczekiwaną liczbą zliczeń w tabeli lub histogramie, ale pewną wariancją określoną eksperymentalnie. Tak czy inaczej, zawsze miałem wrażenie, że test nadal wykorzystuje asymptotyczną normalność wielomianowego pliku PDF (tj. Moja statystyka testu to

Q=(nNm)V1(nNm)

i jest asymptotycznie wielomianowy, gdzie oznacza macierz kowariancji). Dlatego ma rozkład chi-kwadrat o dużej więc użycie oczekiwanej liczby zliczeń, ponieważ mianownik w statystyce staje się ważny dla dużej . Możliwe, że dotyczy to tylko histogramów, od lat nie analizowałem małej tabeli danych.(nNm)VQnn

Czy brakuje mi bardziej subtelnego argumentu, którego mi brakuje? Byłbym zainteresowany referencją, a jeszcze lepiej krótkim wyjaśnieniem. (Chociaż jest to możliwe, właśnie głosowałem za pominięciem słowa asymptotycznego, co, jak przyznam, jest raczej ważne).

Melonik
źródło
W związku z tym przypuszczalnie prawdą jest również to, że można zastosować dokładnie ten sam test z dowolnymi normalnie dystrybuowanymi danymi. Gdybym miał użyć woltomierza, o którym wiedziałem, że ma jakiś normalnie rozłożony błąd, który ustaliłem, mógłbym użyć,
χ2=i(VobsVexp)2σ2
. Czy to prawda? Statystyka zredukowanego chi-kwadrat prawdopodobnie opiera się na tym fakcie.
Bowler

Odpowiedzi:

1

Test chi-kwadrat ma na celu analizę danych kategorycznych. Oznacza to, że dane zostały policzone i podzielone na kategorie. Nie będzie działać z danymi parametrycznymi lub ciągłymi. Więc nie działa ustalenie dopasowania wynikowego w każdym przypadku.

Źródło: http://www.ling.upenn.edu/~clight/chisquared.htm

BradHanks
źródło
4
Witamy na tej stronie! Nie jestem pewien, czy rozumiem, w jaki sposób odnosi się to do omawianego pytania. Czy mógłbyś trochę rozszerzyć tę odpowiedź, pamiętając, że ten wątek prawdopodobnie bardziej dotyczy testu dobroci dopasowania niż analizy dwustronnych tabel awaryjnych?
chl
Być może źle zrozumiałem pytanie, ale zastanawiałem się, czy test chi-kwadrat był odpowiedni w tym przykładzie. Mogę być trochę zardzewiały ...
BradHanks
1
χ2χ2