Próbuję zaktualizować mój model oparty na lm (), aby uzyskać poprawne standardowe błędy i testy. Jestem naprawdę zdezorientowany, której matrycy VC użyć. Do sandwich
oferty pakietowe vcovHC
, vcovHAC
i NeweyWest
. Podczas gdy te pierwsze uwzględniają tylko heteroskedastyczność, drugie dwa uwzględniają zarówno szeregową korelację, jak i heteroskedastyczność. Jednak dokumentacja niewiele mówi o różnicy między tymi dwoma ostatnimi (przynajmniej tego nie rozumiem). Patrząc na samą funkcję, zdałem sobie sprawę, że NeweyWest faktycznie wywołuje vcovHAC.
Empirycznie wyniki coeftest(mymodel, vcov. = vcovHAC)
i coeftest(mymodel, vcov. = NeweyWest)
są szalenie różne. Chociaż vcovHAC
jest nieco zbliżony do naiwnych wyników lm, użycie NeweyWest sprawia, że wszystkie współczynniki stają się nieistotne (testy nawet bliskie 1).
źródło
vcovHAC
się różniNeweyWest
. Podsumowując, różne metody HAC różnią się jedynie wyborem wag.NeweyWest
ma określone wagi,vcovHAC
jest funkcją ogólną, która pozwala podać własne wagi i domyślnie używa wag Andrewsa.Odpowiedzi:
„Kanapka”, o której mowa, to dwa kawałki chleba określone oczekiwaną informacją, obejmujące mięso określone przez obserwowaną informację. Zobacz moje komentarze tutaj i tutaj . W przypadku regresji liniowej równanie szacunkowe wynosi:
Oczekiwana informacja (chleb) to:
Obserwowane informacje (mięso) to:
Należy zauważyć, że wewnętrzny termin jest przekątną stałych reszt, gdy spełnione są homoscedastyczność, niezależne założenie danych, następnie estymator kowariancji kanapkowej, który jest podany przez jest zwykle macierzą kowariancji regresji liniowej gdzie jest wariantem reszt. To jednak dość surowe. Otrzymujesz znacznie szerszą klasę estymatorów, rozluźniając założenia związane z macierzą rezydualną : .A−1BA−1 σ2(XTX)−1 σ2 n×n
vcovHC
Estymator „HC0” jest spójny, nawet jeśli dane nie są niezależne. Nie powiem więc, że „zakładamy”, że reszty są niezależne, ale powiem, że używamy „działającej niezależnej struktury kowariancji”. Następnie macierz zostaje zastąpiona przekątną resztTen estymator działa naprawdę dobrze, z wyjątkiem małych próbek (często rzekomo <40). HC1-3 to różne korekty próbek skończonych. HC3 jest na ogół najlepiej działający.
Jeśli jednak występują efekty autoregresyjne, nie przekątne wpisy są niezerowe, więc powstaje skalowana macierz kowariancji w oparciu o powszechnie stosowane struktury autoregresyjne. Jest to uzasadnienie dla „vcovHAC”. Tutaj tworzone są bardzo elastyczne i ogólne metody szacowania efektu autoregresji: szczegóły mogą wykraczać poza zakres twojego pytania. Funkcja „meatHAC” jest ogólnym koniem roboczym: domyślną metodą jest Andrews. Newey-West jest szczególnym przypadkiem ogólnego autoregresyjnego estymatora błędów. Metody te rozwiązują jeden z dwóch problemów: 1. z jaką prędkością maleje korelacja między „sąsiadującymi” obserwacjami i 2. jaka jest rozsądna odległość między dwiema obserwacjami? Te Jeśli masz zrównoważone dane panelowe, ten estymator kowariancji jest przesadą.T
gee
gee
zamiast tego określa strukturę kowariancjiAR-1
lub podobną.Co do zastosowania, zależy od charakteru analizy danych i pytania naukowego. Nie radzę dopasowywać wszystkich typów i wybierać ten, który wygląda najlepiej, ponieważ jest to problem wielokrotnego testowania. Jak wspomniałem wcześniej, estymator vcovHC jest spójny nawet w obecności efektu autoregresji, dzięki czemu można stosować i uzasadniać „działający model korelacji niezależności” w różnych okolicznościach.
źródło