Czy ktoś może mi krótko wyjaśnić, dlaczego każde z sześciu założeń jest potrzebne do obliczenia estymatora OLS? Odkryłem tylko o wielokoliniowości - że jeśli istnieje, nie możemy odwrócić macierzy (X'X), a tym samym oszacować ogólny estymator. A co z innymi (np. Liniowość, błędy o wartości zero, itp.)?
14
Odpowiedzi:
Zawsze możesz obliczyć estymator OLS, z wyjątkiem przypadku, gdy masz doskonałą wielokoliniowość. W tym przypadku macie doskonałą zależność wieloliniową w macierzy X. W związku z tym założenie pełnej rangi nie zostało spełnione i nie można obliczyć estymatora OLS z powodu problemów z odwracalnością.
Technicznie nie potrzebujesz innych założeń OLS do obliczenia estymatora OLS. Jednak zgodnie z twierdzeniem Gaussa-Markowa należy spełnić założenie OLS (założenia clrm), aby estymator był NIEBIESKI.
Obszerne omówienie twierdzenia Gaussa-Markowa i jego matematycznej pochodnej znajduje się tutaj:
http://economictheoryblog.com/2015/02/26/markov_theorem/
Ponadto, jeśli szukasz przeglądu założeń OLS, tj. Ile ich jest, czego wymagają i co się stanie, jeśli złamiesz pojedyncze założenie OLS, możesz znaleźć tutaj szczegółową dyskusję:
http://economictheoryblog.com/2015/04/01/ols_assumptions/
Mam nadzieję, że to pomaga, na zdrowie!
źródło
Poniższe opiera się na prostych przekrojach, dla szeregów czasowych i paneli jest nieco inaczej.
Teraz implikacje.
Poniżej 1 - 6 (założenia klasycznego modelu liniowego) OLS jest NIEBIESKI (najlepszy liniowy obiektywny estymator), najlepszy w sensie najniższej wariancji. Jest także skuteczny wśród wszystkich estymatorów liniowych, a także wszystkich estymatorów, które wykorzystują jakąś funkcję x. Co ważniejsze, poniżej 1 - 6, OLS jest także obiektywnym estymatorem minimalnej wariancji. Oznacza to, że spośród wszystkich obiektywnych estymatorów (nie tylko liniowych) OLS ma najmniejszą wariancję. OLS jest również spójny.
Poniżej 1 - 5 (założenia Gaussa-Markowa) OLS jest NIEBIESKI i wydajny (jak opisano powyżej).
Poniżej 1–4 OLS jest bezstronny i konsekwentny.
W rzeczywistości OLS jest również spójny, przy słabszym założeniu niż a mianowicie, że: ( 1 ) E ( u ) = 0 i ( 2 ) C o v ( x j , u ) = 0 . Różnica w stosunku do założeń 4 polega na tym, że zgodnie z tym założeniem nie trzeba idealnie nawiązywać do zależności funkcjonalnej.(4) (1) E(u)=0 (2) Cov(xj,u)=0
źródło
Komentarz w innym pytaniu wzbudził wątpliwości co do znaczenia warunku , argumentując, że można go poprawić poprzez włączenie stałego terminu do specyfikacji regresji, a zatem „można go łatwo zignorować”.E(u∣X)=0
Tak nie jest. Włączenie stałego składnika do regresji pochłonie potencjalnie niezerową średnią warunkową błędu, jeśli założymy, że ta średnia warunkowa jest już stała, a nie funkcją regresorów . Jest to kluczowe założenie, które należy przyjąć niezależnie od tego, czy uwzględniamy stały termin, czy nie:
Jeśli tak się stanie, wówczas niezerowa średnia staje się uciążliwością, którą możemy po prostu rozwiązać, dołączając stały składnik.
Ale jeśli tak się nie stanie (tj. Jeśli średnia warunkowa nie jest stałą zerową lub niezerową ), włączenie terminu stałego nie rozwiązuje problemu: to, co „absorbuje” w tym przypadku, jest wielkością zależy to od konkretnej próby i realizacji regresorów. W rzeczywistości nieznany współczynnik przypisany do szeregu jedności nie jest tak naprawdę stały, ale zmienny, w zależności od regresorów poprzez niestałą średnią warunkową składnika błędu.
Co to oznacza? Aby uprościć, załóżmy najprostszy przypadek, w którym ( i indeksuje obserwacje), ale E ( u i ∣ x i ) = h ( x i ) . To znaczy, że termin średni błąd jest niezależny od regresorów z wyjątkiem jego ówczesnych te (w X mamy nie obejmują serię jedynek).E(ui∣X−i)=0 i E(ui∣xi)=h(xi) X
Załóżmy, że określamy regresję z uwzględnieniem stałego terminu (regresor szeregu jednych).
i notacja kompaktowania
gdzie , Z = [ 1 : X ] , γ = ( , P ) ' , ε = U - .a=(a,a,a...)′ Z=[1:X] γ=(a,β)′ ε=u−a
Wtedy będzie estymator OLS
Dla bezstronności potrzebujemy . AleE[ε∣Z]=0
który nie może być zerowy dla wszystkich , ponieważ badamy przypadek, w którym h ( x i ) nie jest funkcją stałą. Więci h(xi)
i
Ponadto, termin błędu ma inną średnią dla każdego i , a więc także inną wariancję (tj. Jest warunkowo heteroskedastyczny). Więc jego dystrybucja uwarunkowane regresorów różni się w uwagach í .ε i i
Ale to oznacza, że nawet jeśli termin błąd zakłada się normalne, a następnie rozkład błędu próbkowania y - γ będzie normalne, ale nie zerową średnią mormal iz nieznanego błędu. I wariancja będzie się różnić. Więcui γ^−γ
Innymi słowy, właściwości „skończonej próbki” zniknęły.
Pozostaje nam tylko skorzystać z asymptotycznie ważnego wnioskowania, dla którego będziemy musieli poczynić dodatkowe założenia.
So simply put, Strict Exogeneity cannot be "easily ignored".
źródło