Przedział ufności dla różnicy średnich w regresji

10

Załóżmy, że mam model regresji kwadratowej z błędami spełniającymi zwykłe założenia (niezależne, normalne, niezależne od wartości ). Niech będą szacunkami najmniejszych kwadratów.

Y=β0+β1X+β2X2+ϵ
ϵXb0,b1,b2

Mam dwie nowe wartości i i jestem zainteresowany uzyskaniem przedziału ufności dla .Xx1x2v=E(Y|X=x2)E(Y|X=x1)=β1(x2x1)+β2(x22x12)

Szacunkowy punkt to i (popraw mnie, jeśli się mylę) mogę oszacować wariancję za pomocą przy użyciu oszacowań wariancji i kowariancji współczynników podanych przez oprogramowanie.v^=b1(x2x1)+b2(x22x12)

s^2=(x2x1)2Var(b1)+(x22x12)2Var(b2)+2(x2x1)(x2x12)Cov(b1,b2)

Mógłbym użyć normalnego przybliżenia i wziąć jako 95% przedział ufności dla , lub mógłbym użyć przedziału ufności bootstrap, ale istnieje sposób, aby obliczyć dokładny rozkład i użyć tego?v^±1.96s^v

mark999
źródło
2
Ponieważ błędy są przyjmowane jako normalne, to parametr szacuje - będące liniowymi funkcjami danych, skąd również błędy - same w sobie muszą być normalne, co oznacza rozkład normalny dla . v^
whuber
Więc mówisz, że normalny przedział ufności jest prawidłowy? Jeśli dobrze rozumiem, zgodnie z tą logiką zastosowalibyśmy również normalne przedziały ufności dla parametrów. Ale używamy przedziałów opartych na rozkładzie T.
mark999
Zastosowano rozkład t, ponieważ szacujesz wariancję błędu; gdyby to było znane, miałbyś normalny rozkład, jak mówi @whuber.
JMS
Dzięki za komentarz. Pytam, czy rozkład t można również zastosować do przedziału ufności dla v zdefiniowanego w pytaniu, a jeśli tak, to z iloma stopniami swobody?
mark999
Wszystkie wariancje i kowariancje zależą ostatecznie od szacowanej wariancji reszt. Zatem zastosowanym DF jest DF w tym oszacowaniu, równy liczbie wartości danych minus liczba parametrów (w tym stała).
whuber

Odpowiedzi:

9

Ogólny wynik można oczekujemy (w podanych założenia) wygląda następująco: Do regresji liniowej z predyktorami (trzeba dwa, i ) i osią, a następnie obserwacji matrycy projektu, estymator wymiarów ipXX2nXn×(p+1)β^p+1aRp+1

aTβ^aTβσ^aT(XTX)1atnp1.

W konsekwencji możesz konstruować przedziały ufności dla dowolnej liniowej kombinacji wektora przy użyciu tego samego rozkładu którego używasz do konstruowania przedziału ufności dla jednej ze współrzędnych.βt

W twoim przypadku oraz . Mianownik w powyższej formule jest pierwiastkiem kwadratowym z tego, co obliczasz, jako oszacowania standardowego błędu (pod warunkiem, że to właśnie oblicza oprogramowanie ...). Zauważ, że estymator wariancji, , ma być (zwykłym) obiektywnym estymatorem, w którym dzielimy przez stopnie swobody, , a nie liczbę obserwacji .p=2aT=(0,x2x1,x22x12)σ^2np1n

NRH
źródło
1
Dziękuję, właśnie tego szukałem. Ale czy formuła zawiera błąd? Wymiary nie pasują . Czy powinno być macierzą mającą macierze w pierwszej kolumnie? aT(XTX)1aXn×(p+1)
mark999
@ mark999, tak, ma kolumn. Poprawiłem to w odpowiedzi. Dzięki. Xp+1
NRH