Jak obliczyć przedział predykcji dla regresji wielokrotnej OLS?

24

Co to jest notacja algebraiczna do obliczania przedziału predykcji dla regresji wielokrotnej?

Brzmi głupio, ale mam problem ze znalezieniem wyraźnej algebraicznej notacji tego.

Michał
źródło

Odpowiedzi:

31

Weź model regresji z obserwacjami N i k regresorami:

y=Xβ+u

Biorąc pod uwagę wektor x0 , przewidywana wartość dla tej obserwacji wynosiłaby

E[y|x0]=y^0=x0β^.
Spójne estymatorem wariancji to przewidywanie jest V P = S 2x 0( X ' X ) - 1 x ' 0 , gdzie s 2 = Ď N i = 1
V^p=s2x0(XX)1x0,
s2=Σi=1Nu^i2Nk.
Błąd Prognoza dla danegoy0jest e =y0 - r 0=x0β+U0 - r 0. Kowariancja zerowego międzyu0i p oznacza, że VR[ e ]=VR[ y 0]+V
e^=y0y^0=x0β+u0y^0.
u0β^
Var[e^]=Var[y^0]+Var[u0],
i spójne estymatorem to V f = s 2x 0( X ' X ) - 1 x " 0 + s 2 .
V^f=s2x0(XX)1x0+s2.

1α confidence odstęp wynosi:

y0±t1α/2V^p.
1α prediction
y0±t1α/2V^f.

Dimitriy V. Masterov
źródło
Powyższa odpowiedź jest bardzo dobrze wykonana, ale myślę, że to źródło pomaga zapewnić kontekst dla pytania.
Czerwiec Skeeter
@Dimitriy Uważam, że Twój drugi eqn powinien mieć marchewkę / kapelusz „^” nad β.
Don Slowik
Czy błąd prognozy nie jest resztą: mi^=u^?
Don Slowik