Co to jest zmienna instrumentalna?

36

Zmienne instrumentalne stają się coraz bardziej popularne w ekonomii stosowanej i statystyce. Czy dla niewtajemniczonych możemy uzyskać nietechniczne odpowiedzi na następujące pytania:

  1. Co to jest zmienna instrumentalna?
  2. Kiedy chciałbyś zastosować zmienną instrumentalną?
  3. Jak znaleźć lub wybrać zmienną instrumentalną?
Graham Cookson
źródło
4
Czy nie uważasz, że artykuł w Wikipedii na ten temat wystarczy?
1
Takie pytania wymagają odpowiedzi typu post na wiki / blogu. Myślę, że pytania nie powinny wymagać tak długich odpowiedzi.
Nie jestem pewien, czy należy po prostu zignorować to pytanie i skierować pytającego na wiki - szczególnie podczas wersji beta, w której staramy się rozbudować zawartość witryny. Być może pytający powinien przesłać każde z tych pytań indywidualnie, aby można było lepiej je rozwiązać.
russellpierce
3
@mbq - przykład z Wikipedii prawie nie kwalifikuje się jako nietechniczny. Jest bardzo zależny od żargonu i równań.
rolando2
1
W latach 80. stało się powszechne w ekonomii. Niektórzy biostatyk również o nim słyszeli i stosują go w kontekście modeli błędów pomiaru, w których instrumenty są wąsko uważane za dodatkowe dostępne pomiary. Kwalifikują się jako instrumenty w szerszym kontekście ekonometrycznym: są skorelowane ze zmienną będącą przedmiotem zainteresowania i nie są skorelowane z błędem pomiaru.
StasK

Odpowiedzi:

41

[Poniższe być może wydaje się trochę techniczne ze względu na zastosowanie równań, ale opiera się głównie na wykresach strzałek, aby zapewnić intuicję, która wymaga jedynie bardzo podstawowej znajomości OLS - więc nie odpieraj się.]

Załóżmy, że chcemy, aby oszacować wpływ przyczynowy na Y i podane przez szacowany współczynnik dla beta , ale z jakiegoś powodu nie ma korelacji między zmienną objaśniającą a termin błędzie:xiyiβ

yja=α+βxja+ϵjadoorr

To może się zdarzyć, bo zapomniał włączyć ważną zmienną, która również koreluje z . Problem ten jest znany jako pominięte zmienne nastawienia i wówczas β nie daje efektu przyczynowego (patrz tutaj dla szczegółów). Jest to przypadek, gdy chcesz użyć instrumentu, ponieważ tylko wtedy możesz znaleźć prawdziwy efekt przyczynowy.xjaβ^

Instrument jest nową zmienną która jest nieskorelowana z ϵ i , ale która dobrze koreluje z x i i która wpływa tylko na y i przez x i - więc nasz instrument jest tak zwany „egzogeniczny”. To jest jak na tej tabeli tutaj:zjaϵjaxjayjaxja

zjaxjayjaϵja

Jak więc korzystać z tej nowej zmiennej?
Być może pamiętasz ideę typu ANOVA kryjącą się za regresją, w której dzielisz całkowitą zmienność zmiennej zależnej na wyjaśniony i niewyjaśniony składnik. Na przykład, jeśli regresujesz swoje na instrumencie,xja

xjacałkowita zmienność=za+πzjawyjaśniona odmiana+ηjaniewyjaśniona odmiana

wtedy wiesz, że wyjaśniona tutaj odmiana jest egzogeniczna w stosunku do naszego pierwotnego równania, ponieważ zależy tylko od egzogenicznej zmiennej . W tym sensie podzieliliśmy nasze x i na część, którą możemy twierdzić, że jest z pewnością egzogenna (jest to część, która zależy od z i ) i pewną niewyjaśnioną część η i, która zachowuje wszystkie złe warianty, które korelują z ϵ i . Teraz bierzemy egzogeniczną część tej regresji, nazwijmy to ^ x i ,zjaxjazjaηjaϵjaxja^

xja=za+πzjadobra odmiana=x^ja+ηjazła odmiana

i umieścić to w naszej pierwotnej regresji:

yja=α+βx^ja+ϵja

Teraz od X i nie jest już skorelowany z ε I (należy pamiętać, że „odfiltrowane” ta część z X I i zostawił go w η I ), możemy oszacować konsekwentnie naszą p ponieważ przyrząd pomógł nam przełamać korelację pomiędzy wyjaśnienie zmienne i błąd. To był jeden ze sposobów na zastosowanie zmiennych instrumentalnych. Metoda ta jest w rzeczywistości nazywa się 2-poziomowy najmniejszych kwadratów, gdzie nasza regresji x i na Z i nazywany jest „pierwszy etap” a ostatni równanie tutaj nazywa się „drugi etap”.x^jaϵjaxjaηjaβxjazja

Pod względem naszego oryginalnego obrazu (I pominąć nie zrobić bałaganu jednak pamiętać, że jest tam!), Zamiast brać bezpośredni ale błędną drogę między X i do rw I wzięliśmy etap pośredni poprzez x íϵjaxjayjax^ja

x^jazjaxjayja

Dzięki temu niewielkiemu odwróceniu naszej drogi do skutku przyczynowego byliśmy w stanie konsekwentnie oszacować za pomocą przyrządu. Kosztem tego przekierowania jest to, że modele zmiennych instrumentalnych są na ogół mniej precyzyjne, co oznacza, że ​​mają one zwykle większe błędy standardowe.β

Jak znaleźć instrumenty?
To nie jest łatwe pytanie, ponieważ musisz dobrze uzasadnić, dlaczego twój nie byłby skorelowany z ϵ i - nie można tego formalnie przetestować, ponieważ prawdziwy błąd nie jest obserwowany. Głównym wyzwaniem jest zatem wymyślenie czegoś, co może być postrzegane jako egzogeniczne, takiego jak klęski żywiołowe, zmiany polityki, a czasem można nawet przeprowadzić randomizowany eksperyment. Inne odpowiedzi zawierały kilka bardzo dobrych przykładów, więc nie powtórzę tej części.zjaϵja

Andy
źródło
10
+1 Jestem w końcu wdzięczny za przeczytanie szczegółowej odpowiedzi zamiast listy referencji lub linków.
whuber
1
Doskonały! Wyjaśniam to moim uczniom bardziej „mnemonicznie”, ponieważ: jest zatruty / skażony przez nieobserwowane czynniki w ϵ . Regresja pierwszego etapu „oczyszcza” / wysysa jad z x . Możemy użyć „oczyszczonej” wersji x, aby znaleźć współczynnik przyczynowy β . xϵxxβ
MichaelChirico
Czy istnieje intuicyjny argument, dlaczego oszacowanie 2SLS dla jest spójne? Kiedy możemy obliczyć x i jesteśmy „odfiltrowanie” część x I , który jest skorelowany z błędem, ale dlaczego miałoby być to, że filtrowanie nie zmienia x I w taki sposób, że zmienia się nasz szacunek dla p ? βx^ixixiβ
user35734
Zobacz tutaj: stats.stackexchange.com/questions/64279/... lub możesz zadać nowe pytanie. Mam nadzieję że to pomoże.
Andy
@ user35734 nie jest spójny, ale asymptotycznie spójny.
Vim
17

Jako statystyczny lekarz bez wcześniejszej wiedzy na temat ekonomii (etr), walczyłem ze zmiennymi instrumentalnymi, ponieważ często starałem się podążać za ich przykładami i nie rozumiałem ich raczej odmiennej terminologii (np. „Endogeniczność”, „zredukowana forma” ”,„ równanie strukturalne ”,„ zmienne pominięte ”). Oto kilka referencji, które uznałem za przydatne (pierwsza powinna być dostępna bezpłatnie, ale obawiam się, że inne prawdopodobnie wymagają subskrypcji):

Poleciłbym również rozdział 4:

jeden przystanek
źródło
7

Nietechniczne (zazwyczaj i tak na to i tak jestem dobry): Są chwile, kiedy X nie tylko powoduje Y, ale Y również powoduje X. Zmienna instrumentalna to urządzenie, które może „wyczyścić” tę niechlujną, niewygodną relację, aby można było jak najlepiej oszacować wpływ X na Y.

Zmienna instrumentalna jest wybierana na podstawie jej zależności: jest przyczyną X, ale poza działaniem przez X, nie ma wpływu na Y. Instrument (lub instrumenty) jest używany w Etapie Pierwszym do obliczenia nowej „wersji” „X, który w żaden sposób nie jest funkcją Y. Ten nowy„ przewidywany ”X jest następnie używany w drugim etapie, w bardziej standardowej regresji, w celu wyjaśnienia / przewidywania Y. Stąd termin„ dwuetapowa regresja najmniejszych kwadratów ” .

Zazwyczaj IV znajduje się w procesach, które są nadrzędne lub poza kontrolą X LUB Y, takie jak zmienne zależne od praw, zasad, aktów natury itp.

rolando2
źródło