Test dwóch próbek chi do kwadratu

10

To pytanie pochodzi z książki Van der Vaarta Asymptotic Statistics, str. 253. # 3:

Załóżmy, że Xm i Yn to niezależne wielomianowy wektorów parametrów (m,a1,,ak) a (n,b1,,bk) . Zgodnie z hipotezą zerową, że I = b I wskazują, żeai=bi

maχ 2 k - 1 dystrybucji. gdzie C i=(Xm,I+Yn,i)/(m+n).

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
χk12c^i=(Xm,i+Yn,i)/(m+n)

Potrzebuję pomocy na początku. Jaka jest tutaj strategia? Udało mi się połączyć dwa lata w:

i=1k(mYn,inXm,i)2mn(m+n)c^i

ale przyzwyczajenie pracy z CLT ponieważ jego ważonej kombinacji i Y n . Nie jestem pewien, czy to właściwa ścieżka. Jakieś sugestie?XmYn

EDYCJA: jeśli to jest dość łatwe, ponieważ otrzymujemym=n

mYnnXmmn(m+n)=YnXm(m+n)

gdzie licznik może być postrzegana jako suma różnic wielomianu zmiennych więc możemy zastosować CLT a następnie zakończyć ją z twierdzenia 17.2 z tego samego rozdziału. Nie mogę jednak wymyślić, jak to zrobić w tej sytuacji przy różnych wielkościach próbek. Jakaś pomoc?(1,a1,,ak)

Link do rozdziału 17 książek Google van van Vaarta

bdeonovic
źródło

Odpowiedzi:

6

Najpierw notacja. Niech , a { T T } 1 , ... , n oznacza kategoryczne sekwencję związanego z X, m i Y, n , tj Pr { X t = i } = o I , Pr { Y t = I } = b i . Niech N = n + m{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m. Rozważ binerizacje gdzieδi,j1i=jto Kronecker Delta. Mamy więcXm,i= N t =

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
So we can write the test statistic as
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

Next note that

nXm,imYn,i=t=1NnXt,imYt,i=Zi
with the following properties
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

and so by multivariate CLT we have

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
where the (i,j)th element of Σ, σij=ai(δijaj). Since c^=(c^1,,c^k)p(a1,,ak)=a By Slutsky we have
nXmmYnnm(n+m)c^DN(0,Ikaa)
where Ik is the k×k identity matrix, a=(a1,,ak). Since Ikaa has eigenvalue 0 of multiplicty 1 and eigenvalue 1 of multiplicity k1, by the continuous mapping theorem (or see Lemma 17.1, Theorem 17.2 of van der Vaart) we have
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
bdeonovic
źródło