Gdy (tzn. pochodzi z modelu regresji liniowej), w tym przypadku resztki są skorelowane i nie są niezależne. Ale kiedy wykonujemy diagnostykę regresji i chcemy przetestować założenie , każdy podręcznik sugeruje użycie wykresów Q – Q i testów statystycznych dla reszt które zostały zaprojektowane do testowania, czy dla niektórych .
Dlaczego dla tych testów nie ma znaczenia, że reszty są skorelowane, a nie niezależne? Często zaleca się stosowanie standardowych reszt: ale to czyni je tylko homoscedastycznymi, a nie niezależnymi.
Przeformułowanie pytania: Reszty z regresji OLS są skorelowane. Rozumiem, że w praktyce korelacje te są tak małe (przez większość czasu? Zawsze?), Że można je zignorować podczas testowania, czy reszty pochodzą z rozkładu normalnego. Moje pytanie brzmi: dlaczego?
źródło
Odpowiedzi:
W twojej notacji jest rzutem i przestrzenią kolumny , tj. Podprzestrzenią obejmującą wszystkie regresory. Dlatego jest rzutem na wszystko prostopadle do podprzestrzeni rozpiętej przez wszystkie regresory.H. X M.: =jan- H
Jeśli , to jest pojedynczo rozłożony normalnie, a elementy są skorelowane, jak pan mówi.X∈Rn × k mi^∈Rn
Błędy są niedostrzegalna i na ogół nie są prostopadłe do podprzestrzeni rozpiętej przez . Dla celów argumentu załóżmy, że błąd . Gdyby tak było, mielibyśmy z . Ponieważ , możemy rozłożyć i uzyskać true .ε X rozpiętość ε ⊥( X) y= Xβ+ ε =y~+ ε y~⊥ ε y~= Xβ∈ zakres( X) y ε
Załóżmy, że mamy bazę z , gdzie pierwszy wektor obejmuje podprzestrzeń nazwa i pozostałe span . Ogólnie rzecz biorąc, błąd będzie miał niezerowe komponenty dla . Te niezerowe komponenty zostaną pomieszane z i dlatego nie można ich odzyskać przez projekcję na .b1, ... ,bn Rn b1, ... ,bk Zakres( X) bk + 1, ... ,bn Zakres( X)⊥ ε =α1b1+ … +αnbn αja i ∈ { 1 , … , k } Xβ Zakres( X)
Ponieważ nigdy nie możemy mieć nadziei na odzyskanie prawdziwych błędów i są skorelowane w liczbie pojedynczej wymiarowej normalnej, moglibyśmy przekształcić . Tam możemy mieć tj. jest niepodzielną nieskorelowaną i homoscedastyczną rozkładem normalnym. Reszty nazywane są pozostałości BLUS Thiel jest .ε mi^ n mi^∈Rn↦mi∗∈Rn - k
W krótkim artykule o badaniu zaburzeń regresji dla normalności znajduje się porównanie reszt OLS i BLUS. W testowanym ustawieniu Monte Carlo reszty OLS są lepsze niż reszty BLUS. Ale to powinno dać ci punkt wyjścia.
źródło