Angrist i Pischke zasugerowali, że Odporne (tj. Odporne na heteroskedastyczność lub nierówne wariancje) Błędy standardowe są zgłaszane jako rzecz oczywista, a nie testowanie. Dwa pytania:
- Jaki jest wpływ na standardowe błędy popełniane w przypadku homoskedastyczności?
- Czy ktoś faktycznie robi to w swojej pracy?
regression
standard-error
heteroscedasticity
robust-standard-error
Graham Cookson
źródło
źródło
Odpowiedzi:
Stosowanie solidnych standardowych błędów stało się powszechną praktyką w ekonomii. Wytrzymałe błędy standardowe są zwykle większe niż nietrwałe (standardowe?) Błędy standardowe, więc praktykę można postrzegać jako próbę zachowania ostrożności.
W dużych próbkach ( np. Jeśli pracujesz z danymi spisu z milionami obserwacji lub zestawami danych z „tylko” tysiącami obserwacji), testy heteroskedastyczności prawie na pewno okażą się pozytywne, więc takie podejście jest właściwe.
Innym sposobem walki z heteroskedastycznością jest waga ważona metodą najmniejszych kwadratów, ale podejście to zostało odrzucone, ponieważ zmienia oszacowania parametrów, w przeciwieństwie do stosowania solidnych błędów standardowych. Jeśli twoje wagi są nieprawidłowe, twoje szacunki są stronnicze. Jeśli jednak masz odpowiednie wagi, otrzymujesz mniejsze („bardziej wydajne”) błędy standardowe niż OLS z solidnymi błędami standardowymi.
źródło
We wstępnej ekonometrii (Woolridge, wydanie 2009, strona 268) to pytanie zostało rozwiązane. Woolridge twierdzi, że przy zastosowaniu solidnych błędów standardowych uzyskane statystyki t mają rozkłady podobne do dokładnych rozkładów t, jeśli wielkość próbki jest duża. Jeśli wielkość próby jest niewielka, statystyki t uzyskane przy użyciu silnej regresji mogą mieć rozkłady, które nie są zbliżone do rozkładu t, co może prowadzić do wniosku.
źródło
Solidne błędy standardowe zapewniają obiektywne szacunki błędów standardowych przy heteroscedastyczności. Istnieje kilka podręczników statystycznych, które zapewniają obszerną i długą dyskusję na temat solidnych błędów standardowych. Poniższa strona zawiera dość kompleksowe podsumowanie solidnych błędów standardowych:
https://economictheoryblog.com/2016/08/07/robust-standard-errors/
Wracając do twoich pytań. Stosowanie solidnych standardowych błędów nie jest pozbawione zastrzeżeń. Według Woolridge (edycja 2009, strona 268) przy użyciu solidnych błędów standardowych, uzyskane statystyki t mają rozkłady podobne do dokładnych rozkładów t, jeśli wielkość próbki jest duża. Jeśli wielkość próby jest niewielka, statystyki t uzyskane przy użyciu silnej regresji mogą mieć rozkłady, które nie są zbliżone do rozkładu t. To może odrzucić wnioskowanie. Ponadto w przypadku homoscedastyczności solidne błędy standardowe są nadal obiektywne. Jednak nie są wydajne. Oznacza to, że konwencjonalne standardowe błędy są bardziej precyzyjne niż solidne standardowe błędy. Wreszcie stosowanie solidnych błędów standardowych jest powszechną praktyką w wielu dziedzinach akademickich.
źródło
Istnieje wiele powodów, dla których należy unikać stosowania solidnych błędów standardowych. Z technicznego punktu widzenia wariancje są ważone wagami, których w rzeczywistości nie można udowodnić. Zatem szorstkość jest tylko narzędziem kosmetycznym. Ogólnie rzecz biorąc, powinieneś pomyśleć o zmianie modelu. Istnieje wiele implikacji dla radzenia sobie z heterogenicznością w lepszy sposób niż po prostu pomalowanie problemu, który pojawia się na podstawie twoich danych. Weź to za znak, aby zmienić model. Pytanie jest ściśle związane z pytaniem, jak radzić sobie z wartościami odstającymi. Niektórzy ludzie po prostu je usuwają, aby uzyskać lepsze wyniki, jest prawie taki sam, gdy używa się solidnych standardowych błędów, tylko w innym kontekście.
źródło
Myślałem, że biały błąd standardowy i błąd standardowy obliczone w „normalny” sposób (np. Hesji i / lub OPG w przypadku maksymalnego prawdopodobieństwa) były asymptotycznie równoważne w przypadku homoskedastyczności?
Tylko w przypadku heteroskedastyczności „normalny” błąd standardowy będzie nieodpowiedni, co oznacza, że Biały Standardowy Błąd jest odpowiedni z heteroskedastycznością lub bez niej, to znaczy nawet wtedy, gdy model jest homoskedastyczny.
Naprawdę nie mogę mówić o 2, ale nie rozumiem, dlaczego nie chce się obliczać Białej SE i uwzględniać w wynikach.
źródło
Mam podręcznik zatytułowany Wprowadzenie do ekonometrii, wydanie trzecie. autorstwa Stocka i Watsona, który brzmi: „jeśli błędy są heteroskedastyczne, to statystyka t obliczona przy użyciu standardowego błędu tylko homoskedastyczności nie ma standardowego rozkładu normalnego, nawet w dużych próbkach”. Uważam, że nie można przeprowadzić właściwego wnioskowania / testowania hipotez bez możliwości założenia, że statystyka t jest rozłożona jako standardowa normalność. Mam dużo szacunku dla Wooldridge (w rzeczywistości moja klasa dla absolwentów również wykorzystała jego książkę), więc uważam, że to, co mówi o statystykach t za pomocą solidnych SE wymaga odpowiednich próbek, jest zdecydowanie poprawne, ale myślę, że często muszą sobie radzić z wymogiem dużej próby i akceptujemy to. Jednak fakt, że użycie niestabilnych SE nie da statystyki t z właściwym standardowym rozkładem normalnymnawet jeśli masz dużą próbkę, stanowi o wiele większe wyzwanie do pokonania.
źródło