Dlaczego stopnie swobody dla dopasowanych par

9

Jestem przyzwyczajony do znajomości „stopni swobody” jako nr, gdzie masz model liniowy z \ mathbf {y} \ in \ mathbb {R} ^ n , \ mathbf { X} \ in M_ {n \ times p} (\ mathbb {R}) macierz projektowa z rangą r , \ boldsymbol {\ beta} \ in \ mathbb {R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n with \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Z tego, co pamiętam ze statystyki elementarnej (tj. Modeli przedliniowych z algebrą liniową), stopnie swobody dla dopasowanych par t -test to liczba różnic minus 1 . Oznaczałoby to, że X mieć rangę 1. Czy to jest poprawne? Jeśli nie, to dlaczego n1 oznacza stopnie swobody dla testu t dopasowanych par t?

Aby zrozumieć kontekst, załóżmy, że mam model efektów mieszanych

yijk=μi+ some random effects+eijk
gdzie i=1,2 , j=1,,8 i k=1,2 . Nie ma nic specjalnego w μi poza tym, że jest to ustalony efekt, a eijkiidN(0,σe2) . Zakładam, że efekty losowe nie mają znaczenia dla tego problemu, ponieważ w tym przypadku zależy nam tylko na efektach stałych.

Chciałbym podać przedział ufności dla μ1μ2 .

Pokazałem już, że d¯=18dj jest obiektywnym estymatorem μ1μ2 , gdzie dj=y¯1jy¯2j , y¯1j=12ky1jk i y¯21 jest zdefiniowany podobnie. Obliczono punkt oszacowania d¯ .

Pokazałem już, że

sd2=j(djd¯)281
jest obiektywnym estymatorem wariancji dj i dlatego
sd28
jest standardowym błędem d¯ . To zostało obliczone.

Teraz ostatnią częścią jest ustalenie stopni swobody. Na tym etapie zwykle staram się znaleźć macierz projektową - która oczywiście ma rangę 2 - ale mam rozwiązanie tego problemu i mówi, że stopnie swobody wynoszą .81

Dlaczego w kontekście ustalania rangi matrycy projektowej stopnie swobody wynoszą ?81

Edytowano, aby dodać: Być może pomocne w tej dyskusji jest zdefiniowanie statystyki testu. Załóżmy, że mam wektor parametru . W tym przypadku (chyba, że ​​czegoś mi brakuje). Zasadniczo przeprowadzamy test hipotezy gdzie . Następnie statystyki testu podaje który zostałby przetestowany pod względem centralnej dystrybucji za pomocąβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrstopnie swobody, gdzie jest macierzą projektową jak wyżej, a gdzie .X
σ^2=y(IPX)ynr
PX=X(XX)1X
Klarnecista
źródło

Odpowiedzi:

5

Odpowiednio dobrane par -test z pary jest w rzeczywistości tylko jeden przykład -test z próbką o wymiarach . Masz różnic , a są to iid i normalnie dystrybuowane. Pierwsza kolumna po matntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1stopień swobody z powodu ograniczenia liniowego, które mówi, że wszystkie wpisy są równe; drugi ma stopni swobody z powodu ograniczenia liniowego, które mówi, że suma wpisów wynosi .n10
Michael Hardy
źródło
Innymi słowy, powód, dla którego mamy tutaj stopni swobody, nie ma nic wspólnego z modelem liniowym ? n1y=Xβ+ϵ
Klarnecista
1
Ma to związek z tym modelem, w którym macierz jest kolumną s, a to macierz , której jedynym wpisem jest różnica między dwoma średnimi populacji. X1β1×1
Michael Hardy
2
Aha! Więc twój byłby tym wektorem s, prawda? Dziękuję Ci bardzo! Nie mogę uwierzyć, jak trudno było znaleźć na to odpowiedź! ydi
Klarnecista
Tak. Jest to wektor zaobserwowanych różnic w dopasowanych parach. n
Michael Hardy
2

Bardzo, bardzo dziękuję Michaelowi Hardy'emu za odpowiedź na moje pytanie.

Pomysł jest następujący: let i . Zatem naszym modelem liniowym jest gdzie jest -ektorem wszystkich i Oczywiście ma rangę , więc mamy stopni swobody .

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Skąd wiemy, że ustawić na ? Przypomnij sobie, że i jak łatwo to zauważyć, dla wszystkich . Biorąc pod uwagę nasz , oczywiste jest, czym powinien być . To dlatego, że β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
więc powinna być macierzą z .β1×1β=[μ1μ2]

Ustaw . Zatem naszym testem hipotez jest Nasza statystyka testu to zatem Mamy Po pracy można pokazać, że Można również wykazać, żec=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXjest symetryczny i idempotentny. Więc i
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
który oczywiście ma odwrotna , dając w ten sposób statystykę testową która byłaby testowana na centralnym rozkładzie z stopni wolność zgodnie z życzeniem.1/n
μ^1μ^2sd2/n
tn1
Klarnecista
źródło