Załóżmy następującą zależność liniową: , gdzie jest zmienną zależną, pojedynczą zmienną niezależną, a termin błędu.
Według Stock & Watson (Wprowadzenie do ekonometrii; Rozdział 4 ), trzecim najmniejszym kwadratem jest założenie, że czwarte momenty i są niezerowe i skończone .
Mam trzy pytania:
Nie do końca rozumiem rolę tego założenia. Czy OLS jest stronniczy i niespójny, jeśli to założenie się nie sprawdza, czy też potrzebujemy tego założenia do wnioskowania?
Stock i Watson piszą: „założenie to ogranicza prawdopodobieństwo wyciągnięcia obserwacji z wyjątkowo dużymi wartościami lub ”. Mam jednak intuicję, że to założenie jest ekstremalne. Czy mamy kłopoty, jeśli mamy duże wartości odstające (takie, że czwarte momenty są duże), ale jeśli te wartości są wciąż skończone? Nawiasem mówiąc: Jaka jest podstawowa definicja odstająca?
Możemy przeformułować to w następujący sposób: „kurtozę i są niezerowe i skończona?”
Odpowiedzi:
Zdajesz nie potrzeba założenia na 4. momentów dla spójności estymatora OLS, ale trzeba robić założeń potrzebujemy na wyższych momentówx i ϵ dla asymptotycznej normalności i konsekwentnego szacowania, czym jest asymptotyczna macierz kowariancji.
W pewnym sensie jest to jednak punkt matematyczny, techniczny, a nie praktyczny. Aby OLS działał dobrze w skończonych próbkach, w pewnym sensie wymaga więcej niż minimalnych założeń niezbędnych do osiągnięcia asymptotycznej spójności lub normalności, ponieważn→∞ .
Wystarczające warunki dla spójności:
Jeśli masz równanie regresji:
Estymator OLS można zapisać jako:b^
Aby zachować spójność , musisz być w stanie zastosować prawo wielkich liczb Kołmogorowa lub, w przypadku szeregów czasowych z szeregową zależnością, coś w rodzaju twierdzenia Ergodycznego Karlina i Taylora, aby:
Inne potrzebne założenia to:
Następnie a otrzymasz(X′Xn)−1(X′ϵn)→p0 b^→pβ
Jeśli chcesz centralne twierdzenie graniczne zastosować wtedy trzeba założenia dotyczące wyższych momentach, na przykład, gdzie . Centralne twierdzenie o limicie daje asymptotyczną normalność i pozwala mówić o standardowych błędach. Aby istniał drugi moment , potrzebujesz czwartego momentu i . Chcesz argumentować, że gdzieE[gig′i] gi=xiϵi b^ E[gig′i] x ϵ n−−√(1n∑ix′iϵi)→dN(0,Σ) Σ=E[xix′iϵ2i] . Aby to zadziałało, musi być skończona.Σ
Ładna dyskusja (która motywowała ten post) znajduje się w Econometrics Hayashi . (Zobacz także s. 149, aby zapoznać się z 4. momentami i oszacowaniem macierzy kowariancji).
Dyskusja:
Te wymagania dotyczące 4 momentów są prawdopodobnie punktem technicznym, a nie praktycznym. Prawdopodobnie nie spotkasz się z rozkładami patologicznymi, jeśli jest to problem w codziennych danych? Chodzi o bardziej powszechne lub inne założenia OLS.
Innym pytaniem, na które niewątpliwie odpowiedziano w innym miejscu na Stackexchange, jest to, jak duża próbka jest potrzebna, aby próbki skończone zbliżyły się do asymptotycznych wyników. W pewnym sensie fantastyczne wartości odstające prowadzą do powolnej konwergencji. Na przykład spróbuj oszacować średnią rozkładu logarytmicznego z naprawdę dużą wariancją. Średnia próbki jest spójnym, bezstronnym estymatorem średniej populacji, ale w tym logarytmicznym przypadku z szalonym nadmiarem kurtozy itp. (Link), skończone wyniki próby są naprawdę bardzo złe.
Skończone vs. nieskończone jest niezwykle ważnym rozróżnieniem w matematyce. To nie jest problem, który napotykasz w codziennych statystykach. Problemy praktyczne są bardziej w kategorii małej kontra dużej. Czy wariancja, kurtoza itp. Są wystarczająco małe, aby uzyskać rozsądne oszacowania na podstawie wielkości mojej próbki?
Patologiczny przykład, w którym estymator OLS jest spójny, ale nie asymptotycznie normalny
Rozważać:
Rozkład nie jest normalny, ogony są zbyt ciężkie. Ale jeśli zwiększysz stopnie swobody do 3, aby istniał drugi moment , wówczas obowiązuje centralny limit i otrzymujesz:b^ ϵi
Kod do wygenerowania:
źródło
Jest to założenie wystarczające, ale nie minimalne [1]. OLS nie jest stronniczy w tych warunkach, jest po prostu niespójny. Asymptotyczne właściwości OLS rozpadają się, gdy może mieć bardzo duży wpływ i / lub jeśli można uzyskać bardzo duże pozostałości. Być może nie spotkałeś się z formalną prezentacją twierdzenia centralnego limitu Lindeberga Fellera, ale do tego właśnie odnoszą się warunki czwartej chwili, a warunek Lindeberga mówi nam w zasadzie to samo: brak nadmiernych punktów wpływu, brak nadmiernie dużej dźwigni punkty [2].X
Te teoretyczne podstawy statystyki powodują wiele nieporozumień, gdy sprowadza się je do praktycznych zastosowań. Nie ma definicji wartości odstającej, jest to koncepcja intuicyjna. Aby go z grubsza zrozumieć, obserwacja musiałaby być wysokim punktem dźwigni lub wysokim punktem wpływu, np. Takim, dla którego diagnostyka usuwania (DF beta) jest bardzo duża lub dla którego odległość Mahalanobisa w predyktorach jest duża (w statystykach jednowymiarowych to tylko wynik Z). Wróćmy jednak do kwestii praktycznych: jeśli przeprowadzę losową ankietę na temat ludzi i ich dochodów w gospodarstwach domowych, a na 100 osób, 1 z osób, które próbuję, jest milionerem, domyślam się, że milionerzy reprezentują 1% populacji . W wykładzie biostatystycznym te zasady są omawiane i podkreślane, że każde narzędzie diagnostyczne ma zasadniczo charakter eksploracyjny [3].nie „analiza, która wyklucza wartość odstającą, jest tą, w którą wierzę”, to znaczy „usunięcie jednego punktu całkowicie zmieniło moją analizę”.
Kurtoza jest skalowaną wielkością, która zależy od drugiego momentu rozkładu, ale założenie skończonej, niezerowej wariancji dla tych wartości jest milczące, ponieważ nie można zachować tej właściwości w czwartym momencie, ale nie w drugim. Tak w zasadzie tak, ale ogólnie nigdy nie badałem ani kurtozy, ani czwartych chwil. Nie uważam ich za praktyczny ani intuicyjny środek. W dniu, w którym powstaje histogram lub wykres rozproszenia przez pstryknięcie palcami, powinniśmy korzystać z jakościowych graficznych statystyk diagnostycznych, sprawdzając te wykresy.
[1] /math/79773/how-does-one-prove-that-lindeberg-condition-is-satisfied
[2] http://projecteuclid.org/download/pdf_1/euclid.ss/1177013818
[3] http://faculty.washington.edu/semerson/b517_2012/b517L03-2012-10-03/b517L03-2012-10-03.html
źródło