Chciałbym zrozumieć, dlaczego w modelu OLS rozkłada się RSS (resztkową sumę kwadratów)
( oznacza liczbę parametrów w modelu, liczbę obserwacji).
Przepraszam, że zadałem tak podstawowe pytanie, ale wydaje się, że nie jestem w stanie znaleźć odpowiedzi online (lub w moich, bardziej zorientowanych na aplikację podręcznikach).
regression
distributions
least-squares
Tal Galili
źródło
źródło
Odpowiedzi:
Rozważam następujący model liniowy:y=Xβ+ϵ .
Wektor reszt szacowany jest przez
gdzieQ=I−X(X′X)−1X′ .
Zauważ, że (ślad jest niezmienny przy cyklicznej permutacji) i że Q ′ = Q = Q 2 . Wartości własne Q wynoszą zatem 0 i 1 (niektóre szczegóły poniżej). Zatem istnieje macierz jednostkowa V taka, że ( macierze można diagonalizować za pomocą macierzy jednolitych wtedy i tylko wtedy, gdy są one normalne ).tr(Q)=n−p Q′=Q=Q2 Q 0 1 V
Teraz niech ε .K=V′ϵ^
Od ε ~ N ( 0 , Ď 2 Q ) mamy K ~ N ( 0 , Ď 2 Δ ) , a zatem K n - s + 1 = ... = K n = 0 . A zatemϵ^∼N(0,σ2Q) K∼N(0,σ2Δ) Kn−p+1=…=Kn=0
z .K⋆=(K1,…,Kn−p)′
Ponadto, ponieważ jest macierzą jednolitą, my również mamyV
A zatem
Na koniec zauważ, że wynik ten implikuje
Ponieważ The minimal wielomianu o dzieli wielomian . Zatem wartości własne mieszczą się w zakresie od do . Ponieważ jest również sumą wartości własnych pomnożonych przez ich wielokrotność, musimy koniecznie mieć, że jest wartością własną o wielokrotności a zero jest wartością własną o wielokrotności .Q2−Q=0 Q z2−z Q 0 1 tr(Q)=n−p 1 n−p p
źródło
IMHO, notacja matematyczna komplikuje sprawy. Czysty język wektorów jest czystszy. Model można zapisać gdzie ma standardowy rozkład normalny w a zakłada się, że należy do podprzestrzeni wektorowej .Y=Xβ+ϵ Y=μ+σG G Rn μ W⊂Rn
Teraz w grę wchodzi język geometrii elementarnej. Najmniejszych kwadratów estymatora z jest tylko : rzut prostopadły obserwowalny na powierzchni , do którego zakłada się, że miejsce. Wektor reszt jest : rzut na ortogonalnego dopełnienia o w . Wymiar wynosi .μ^ μ PWY Y W μ P⊥WY W⊥ W Rn W⊥ dim(W⊥)=n−dim(W)
Wreszcie, a ma standardowy rozkład normalny na , stąd jego kwadratowa norma ma dystrybucyjnym stopni swobody.
Ta demonstracja używa tylko jednego twierdzenia, a właściwie definicji-twierdzenia:
Definicja i twierdzenie . Losowy wektor w ma standardowy rozkład normalny w przestrzeni wektorowej jeśli przyjmuje swoje wartości w i jego współrzędne w jednej ( we wszystkich) podstawie ortonormalnej o są niezależnymi jednowymiarowej standardowe rozkładu normalnegoRn U⊂Rn U ⟺ U
(z tego twierdzenia dotyczącego definicji twierdzenie Cochrana jest tak oczywiste, że nie warto go podawać)
źródło