Dlaczego rozkład T jest wykorzystywany do hipotez testujących współczynnik regresji liniowej?

17

W praktyce powszechne jest stosowanie standardowego testu T do sprawdzenia znaczenia współczynnika regresji liniowej. Mechanika obliczeń ma dla mnie sens.

Dlaczego rozkład T można wykorzystać do modelowania standardowej statystyki testowej stosowanej w testowaniu hipotez regresji liniowej? Standardowa statystyka testu, o której mowa tutaj:

T0=β^β0SE(β^)
Nate Parke
źródło
Pełna i kompletna odpowiedź na to pytanie będzie dość długa, jestem pewien. Więc czekając, aż ktoś to rozwiąże, możesz całkiem dobrze zrozumieć, dlaczego tak jest, patrząc na niektóre notatki, które znalazłem tutaj: onlinecourses.science.psu.edu/stat501/node/297 . Zauważ, że . t(np)2=F(1,np)
StatsStudent
1
Nie mogę uwierzyć, że to nie duplikat, a jednak wszystkie głosy poparcia (zarówno w kwestii pytania, jak i odpowiedzi) ... A co z tym ? A może nie jest to duplikat, co oznacza, że ​​istnieją (lub były do ​​dziś) super-podstawowe tematy, które nie zostały omówione przez prawie siedem lat istnienia Cross Validated ... Wow ...
Richard Hardy
@RichardHardy Hmm, to brzmi jak duplikat. Choć jest to bardziej gadatliwy, pytanie jest w szczególności: „W jaki sposób mogę udowodnić, że dla β i , β i - β iβ^i"β^iβisβ^itnk
Firebug

Odpowiedzi:

26

Aby zrozumieć, dlaczego używamy rozkład t, trzeba wiedzieć, co jest podstawową rozkład beta i reszta sumy kwadratów ( R S S ), ponieważ te dwa razem wzięte daje rozkład t.β^RSS

Łatwiej jest to rozkład P , który jest rozkład normalny - oczekuje Należy zauważyć, że β = ( X , T X ) - 1 x T Y jest więc funkcją liniową Y , gdzie Y ~ N ( X β , σ 2)β^β^(XTX)1XTYY . W wyniku tego jest również rozkład normalny, β ~ N ( p , σ 2 ( X , T X ) -YN(Xβ,σ2In)- daj mi znać, jeśli potrzebujesz pomocy wyprowadzenia rozkładu beta .β^N(β,σ2(XTX)1)β^

Dodatkowo, , gdzie n jest liczbą obserwacji, a p jest liczbą parametrów zastosowanych w regresji. Dowód tego jest nieco bardziej zaangażowany, ale także prosty do uzyskania (patrz dowód tutaj Dlaczego RSS jest dystrybuowany chi razy razy np? ).RSSσ2χnp2np

Do tego momentu Rozważałam wszystko w macierz / wektor notacja, ale niech do wykorzystania prostoty β I i używać jej rozkład normalny, który da nam: β i - β iβ^i

β^iβiσ(XTX)ii1N(0,1)

Dodatkowo z rozkładu chi- wynika, że: ( n - p ) s 2RSS

(np)s2σ2χnp2

Było to po prostu przegrupowanie pierwszego wyrażenia chi-kwadrat i jest niezależne od . Dodatkowo definiujemy s 2 = R S SN(0,1) , który jest obiektywnym estymatorem dlaσ2. Zgodnie z definicjątn-pdzielenie rozkładu normalnego przez niezależny kwadrat chi (ponad jego stopnie swobody) daje rozkład t (dla dowodu patrz:norma podzielona przezs2=RSSnpσ2tnp daje T-dowód - dowódχ2(s)/s) otrzymujesz:

β^iβis(XTX)ii1tnp

Gdzie .s(XTX)ii1=SE(β^i)

Daj mi znać, czy to ma sens.

francium87d
źródło
co za świetna odpowiedź! Czy mógłbyś
β^iβiσ(XTX)ii1N(0,1)
?
KingDingeling
4

Odpowiedź jest w rzeczywistości bardzo prosta: używasz t-dystrybucji, ponieważ został właściwie zaprojektowany specjalnie do tego celu.

x1,x2,,xnx¯=i=1nxi/nx¯

σξ=(x¯μ)n/σN(0,1)σσ^σσ^

σ^ββ^σ

Aksakal
źródło