Jeśli w standardowych regresjach OLS zostaną naruszone dwa założenia (normalny rozkład błędów, homoscedastyczność), to czy standardowe błędy początkowe i przedziały ufności są odpowiednią alternatywą dla uzyskania znaczących wyników w odniesieniu do znaczenia współczynników regresora?
Czy testy istotności ze standardowymi błędami ładowania i przedziałami ufności nadal „działają” z heteroscedastycznością?
Jeśli tak, jakie odpowiednie przedziały ufności można zastosować w tym scenariuszu (percentyl, BC, BCA)?
Wreszcie, jeśli w tym scenariuszu właściwe jest ładowanie początkowe, jaka literatura należałoby przeczytać i zacytować, aby dojść do takiego wniosku? Wszelkie wskazówki będą mile widziane!
Odpowiedzi:
Istnieją co najmniej trzy (może być więcej) podejścia do wykonania bootstrapu dla regresji liniowej z niezależnymi, ale nie identycznie rozłożonymi danymi. (Jeśli masz inne naruszenia „standardowych” założeń, np. Z powodu autokorelacji z danymi szeregów czasowych lub grupowania z powodu projektowania próbkowania, sprawy stają się jeszcze bardziej skomplikowane).
Ostatecznym odniesieniem jest Wu (1986) , ale Annals nie są dokładnie czytaniem książek z obrazkami.
AKTUALIZACJE na podstawie dalszych pytań OP zadanych w komentarzach:
Liczba replik wydawała mi się duża; jedyną dobrą dyskusją na temat tego parametru bootstrap, o której jestem świadomy, jest książka Intron do Bootstrap autorstwa Efron & Tibshirani .
Uważam, że ogólnie podobne poprawki braku założeń dystrybucyjnych można uzyskać przy standardowych błędach Hubera / White'a. Podręcznik Camerona i Triverdiego omawia równoważność pary bootstrap i korekcję heteroskedastyczności White'a. Równoważność wynika z ogólnej teorii odporności dla oszacowańZobacz także Hausman i Palmer (2012) na temat bardziej szczegółowych porównań w skończonych próbkach (wersja tego artykułu jest dostępna na jednej ze stron internetowych autorówM ) w porównaniu między korektami bootstrap a korektami heteroskedastyczności.
źródło
reps(2500)
jest prawdopodobnie przesadą, przynajmniej w przypadku standardowych błędów; Myślę, żereps(500)
jest w porządku dla większości praktycznych celów. W książce wprowadzającej Efron & Tibshirani znajduje się sekcja na temat liczby powtórzeń. Mają też cały rozdział o regresji, więc może to być kolejny dobry punkt odniesienia dla ciebie.robust
opcji regresji.est store
oba wyniki iest tab, se
je porównać ze sobą.