Zawsze zgłaszaj solidne (białe) błędy standardowe?

20

Angrist i Pischke zasugerowali, że Odporne (tj. Odporne na heteroskedastyczność lub nierówne wariancje) Błędy standardowe są zgłaszane jako rzecz oczywista, a nie testowanie. Dwa pytania:

  1. Jaki jest wpływ na standardowe błędy popełniane w przypadku homoskedastyczności?
  2. Czy ktoś faktycznie robi to w swojej pracy?
Graham Cookson
źródło
Nie jestem pewien, co rozumiesz przez „Solidne błędy standardowe są zgłaszane jako oczywiste” błędy standardowe? Powiedziałeś, że testowanie na „to”, o jakim teście mówisz?
robin girard
1
Dobra uwaga .... Mówię o standardowych błędach współczynników regresji w regresji OLS i problemie heteroscedastyczności. Tradycyjnym podejściem byłoby testowanie na obecność heteroscedastyczności za pomocą, na przykład, testu White'a lub testu Breuscha Pagana. Jeśli zostanie znaleziona heteroscedastyczność, wówczas zgłosi się Solidne Błędy Standardowe, zwykle Białe Błędy Standardowe.
Graham Cookson,
Czy umieściłbyś link do Angrista i Pischke?
csgillespie
1
Angrist, Joshua D. i Jorn-Steffen Pischke. 2009. Głównie nieszkodliwe ekonometria: towarzysz empirysty. Princeton University Press: Princeton, NJ.
Charlie,

Odpowiedzi:

10

Stosowanie solidnych standardowych błędów stało się powszechną praktyką w ekonomii. Wytrzymałe błędy standardowe są zwykle większe niż nietrwałe (standardowe?) Błędy standardowe, więc praktykę można postrzegać jako próbę zachowania ostrożności.

W dużych próbkach ( np. Jeśli pracujesz z danymi spisu z milionami obserwacji lub zestawami danych z „tylko” tysiącami obserwacji), testy heteroskedastyczności prawie na pewno okażą się pozytywne, więc takie podejście jest właściwe.

Innym sposobem walki z heteroskedastycznością jest waga ważona metodą najmniejszych kwadratów, ale podejście to zostało odrzucone, ponieważ zmienia oszacowania parametrów, w przeciwieństwie do stosowania solidnych błędów standardowych. Jeśli twoje wagi są nieprawidłowe, twoje szacunki są stronnicze. Jeśli jednak masz odpowiednie wagi, otrzymujesz mniejsze („bardziej wydajne”) błędy standardowe niż OLS z solidnymi błędami standardowymi.

Charlie
źródło
1
O ile szersze są solidne błędy standardowe niż zwykłe błędy standardowe, gdy nie narusza się założeń OLS?
russellpierce
1
Nie zawsze w ogóle szersze - w rzeczywistości czasami mogą być węższe. Zobacz najnowszy post na blogu książki Angrist & Pischke za: mostlyharmlesseconometrics.com/2010/12/...
onestop
1
+1, z zastrzeżeniem @ onestop w komentarzu powyżej, że solidne se może równie dobrze być większe lub mniejsze, chociaż zazwyczaj oczekujemy, że będą większe, a zatem błąd „konserwatywny” wrt typu I. I tak, zawsze używam albo heteroskedastic solid, albo klaster solid se, jak wszyscy, których znam.
Cyrus S,
1
Testy na to, że heteroskedastyczność nie okazuje się znacząca, nie są powodem, aby przestać się martwić heteroskedastycznością rujnującą OLS - ten test może nie mieć dużej mocy, nawet jeśli efekt jest obecny.
gość
1
Dobrym powodem, aby nie wypróbować WLS, jest to, że bardzo często nie masz pojęcia, jaka jest prawdziwa relacja średnia-wariancja, a zerknięcie na wybrane dane może unieważnić twoje wnioskowanie o freqentist. Podobnie jak Cyrus, wszędzie używam solidnych se.
gość
6

We wstępnej ekonometrii (Woolridge, wydanie 2009, strona 268) to pytanie zostało rozwiązane. Woolridge twierdzi, że przy zastosowaniu solidnych błędów standardowych uzyskane statystyki t mają rozkłady podobne do dokładnych rozkładów t, jeśli wielkość próbki jest duża. Jeśli wielkość próby jest niewielka, statystyki t uzyskane przy użyciu silnej regresji mogą mieć rozkłady, które nie są zbliżone do rozkładu t, co może prowadzić do wniosku.


źródło
6

Solidne błędy standardowe zapewniają obiektywne szacunki błędów standardowych przy heteroscedastyczności. Istnieje kilka podręczników statystycznych, które zapewniają obszerną i długą dyskusję na temat solidnych błędów standardowych. Poniższa strona zawiera dość kompleksowe podsumowanie solidnych błędów standardowych:

https://economictheoryblog.com/2016/08/07/robust-standard-errors/

Wracając do twoich pytań. Stosowanie solidnych standardowych błędów nie jest pozbawione zastrzeżeń. Według Woolridge (edycja 2009, strona 268) przy użyciu solidnych błędów standardowych, uzyskane statystyki t mają rozkłady podobne do dokładnych rozkładów t, jeśli wielkość próbki jest duża. Jeśli wielkość próby jest niewielka, statystyki t uzyskane przy użyciu silnej regresji mogą mieć rozkłady, które nie są zbliżone do rozkładu t. To może odrzucić wnioskowanie. Ponadto w przypadku homoscedastyczności solidne błędy standardowe są nadal obiektywne. Jednak nie są wydajne. Oznacza to, że konwencjonalne standardowe błędy są bardziej precyzyjne niż solidne standardowe błędy. Wreszcie stosowanie solidnych błędów standardowych jest powszechną praktyką w wielu dziedzinach akademickich.

Flavian Barton
źródło
5

Istnieje wiele powodów, dla których należy unikać stosowania solidnych błędów standardowych. Z technicznego punktu widzenia wariancje są ważone wagami, których w rzeczywistości nie można udowodnić. Zatem szorstkość jest tylko narzędziem kosmetycznym. Ogólnie rzecz biorąc, powinieneś pomyśleć o zmianie modelu. Istnieje wiele implikacji dla radzenia sobie z heterogenicznością w lepszy sposób niż po prostu pomalowanie problemu, który pojawia się na podstawie twoich danych. Weź to za znak, aby zmienić model. Pytanie jest ściśle związane z pytaniem, jak radzić sobie z wartościami odstającymi. Niektórzy ludzie po prostu je usuwają, aby uzyskać lepsze wyniki, jest prawie taki sam, gdy używa się solidnych standardowych błędów, tylko w innym kontekście.

MarkDollar
źródło
To naprawdę zła rada, zawsze używaj solidnych błędów, ponieważ są one spójne w obu przypadkach
Repmat
3

Myślałem, że biały błąd standardowy i błąd standardowy obliczone w „normalny” sposób (np. Hesji i / lub OPG w przypadku maksymalnego prawdopodobieństwa) były asymptotycznie równoważne w przypadku homoskedastyczności?

Tylko w przypadku heteroskedastyczności „normalny” błąd standardowy będzie nieodpowiedni, co oznacza, że ​​Biały Standardowy Błąd jest odpowiedni z heteroskedastycznością lub bez niej, to znaczy nawet wtedy, gdy model jest homoskedastyczny.

Naprawdę nie mogę mówić o 2, ale nie rozumiem, dlaczego nie chce się obliczać Białej SE i uwzględniać w wynikach.

Vivi
źródło
2

Mam podręcznik zatytułowany Wprowadzenie do ekonometrii, wydanie trzecie. autorstwa Stocka i Watsona, który brzmi: „jeśli błędy są heteroskedastyczne, to statystyka t obliczona przy użyciu standardowego błędu tylko homoskedastyczności nie ma standardowego rozkładu normalnego, nawet w dużych próbkach”. Uważam, że nie można przeprowadzić właściwego wnioskowania / testowania hipotez bez możliwości założenia, że ​​statystyka t jest rozłożona jako standardowa normalność. Mam dużo szacunku dla Wooldridge (w rzeczywistości moja klasa dla absolwentów również wykorzystała jego książkę), więc uważam, że to, co mówi o statystykach t za pomocą solidnych SE wymaga odpowiednich próbek, jest zdecydowanie poprawne, ale myślę, że często muszą sobie radzić z wymogiem dużej próby i akceptujemy to. Jednak fakt, że użycie niestabilnych SE nie da statystyki t z właściwym standardowym rozkładem normalnymnawet jeśli masz dużą próbkę, stanowi o wiele większe wyzwanie do pokonania.

Stacey
źródło