Zmienne instrumentalne stają się coraz bardziej popularne w ekonomii stosowanej i statystyce. Czy dla niewtajemniczonych możemy uzyskać nietechniczne odpowiedzi na następujące pytania:
- Co to jest zmienna instrumentalna?
- Kiedy chciałbyś zastosować zmienną instrumentalną?
- Jak znaleźć lub wybrać zmienną instrumentalną?
regression
econometrics
instrumental-variables
Graham Cookson
źródło
źródło
Odpowiedzi:
[Poniższe być może wydaje się trochę techniczne ze względu na zastosowanie równań, ale opiera się głównie na wykresach strzałek, aby zapewnić intuicję, która wymaga jedynie bardzo podstawowej znajomości OLS - więc nie odpieraj się.]
Załóżmy, że chcemy, aby oszacować wpływ przyczynowy na Y i podane przez szacowany współczynnik dla beta , ale z jakiegoś powodu nie ma korelacji między zmienną objaśniającą a termin błędzie:xja yja β
To może się zdarzyć, bo zapomniał włączyć ważną zmienną, która również koreluje z . Problem ten jest znany jako pominięte zmienne nastawienia i wówczas β nie daje efektu przyczynowego (patrz tutaj dla szczegółów). Jest to przypadek, gdy chcesz użyć instrumentu, ponieważ tylko wtedy możesz znaleźć prawdziwy efekt przyczynowy.xja βˆ
Instrument jest nową zmienną która jest nieskorelowana z ϵ i , ale która dobrze koreluje z x i i która wpływa tylko na y i przez x i - więc nasz instrument jest tak zwany „egzogeniczny”. To jest jak na tej tabeli tutaj:zja ϵja xja yja xja
Jak więc korzystać z tej nowej zmiennej?xja
Być może pamiętasz ideę typu ANOVA kryjącą się za regresją, w której dzielisz całkowitą zmienność zmiennej zależnej na wyjaśniony i niewyjaśniony składnik. Na przykład, jeśli regresujesz swoje na instrumencie,
wtedy wiesz, że wyjaśniona tutaj odmiana jest egzogeniczna w stosunku do naszego pierwotnego równania, ponieważ zależy tylko od egzogenicznej zmiennej . W tym sensie podzieliliśmy nasze x i na część, którą możemy twierdzić, że jest z pewnością egzogenna (jest to część, która zależy od z i ) i pewną niewyjaśnioną część η i, która zachowuje wszystkie złe warianty, które korelują z ϵ i . Teraz bierzemy egzogeniczną część tej regresji, nazwijmy to ^ x i ,zja xja zi ηi ϵi xiˆ
i umieścić to w naszej pierwotnej regresji:
Teraz od X i nie jest już skorelowany z ε I (należy pamiętać, że „odfiltrowane” ta część z X I i zostawił go w η I ), możemy oszacować konsekwentnie naszą p ponieważ przyrząd pomógł nam przełamać korelację pomiędzy wyjaśnienie zmienne i błąd. To był jeden ze sposobów na zastosowanie zmiennych instrumentalnych. Metoda ta jest w rzeczywistości nazywa się 2-poziomowy najmniejszych kwadratów, gdzie nasza regresji x i na Z i nazywany jest „pierwszy etap” a ostatni równanie tutaj nazywa się „drugi etap”.xˆja ϵja xja ηja β xja zja
Pod względem naszego oryginalnego obrazu (I pominąć nie zrobić bałaganu jednak pamiętać, że jest tam!), Zamiast brać bezpośredni ale błędną drogę między X i do rw I wzięliśmy etap pośredni poprzez x íϵja xja yja xˆja
Dzięki temu niewielkiemu odwróceniu naszej drogi do skutku przyczynowego byliśmy w stanie konsekwentnie oszacować za pomocą przyrządu. Kosztem tego przekierowania jest to, że modele zmiennych instrumentalnych są na ogół mniej precyzyjne, co oznacza, że mają one zwykle większe błędy standardowe.β
Jak znaleźć instrumenty?zja ϵja
To nie jest łatwe pytanie, ponieważ musisz dobrze uzasadnić, dlaczego twój nie byłby skorelowany z ϵ i - nie można tego formalnie przetestować, ponieważ prawdziwy błąd nie jest obserwowany. Głównym wyzwaniem jest zatem wymyślenie czegoś, co może być postrzegane jako egzogeniczne, takiego jak klęski żywiołowe, zmiany polityki, a czasem można nawet przeprowadzić randomizowany eksperyment. Inne odpowiedzi zawierały kilka bardzo dobrych przykładów, więc nie powtórzę tej części.
źródło
Jako statystyczny lekarz bez wcześniejszej wiedzy na temat ekonomii (etr), walczyłem ze zmiennymi instrumentalnymi, ponieważ często starałem się podążać za ich przykładami i nie rozumiałem ich raczej odmiennej terminologii (np. „Endogeniczność”, „zredukowana forma” ”,„ równanie strukturalne ”,„ zmienne pominięte ”). Oto kilka referencji, które uznałem za przydatne (pierwsza powinna być dostępna bezpłatnie, ale obawiam się, że inne prawdopodobnie wymagają subskrypcji):
Staiger D. Zmienne instrumentalne. Cykliczne seminarium AcademyHealth w zakresie metod badań usług zdrowotnych, marzec 2002 r. Http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm
Newhouse JP, McClellan M. Ekonometria w badaniach wyników: Zastosowanie zmiennych instrumentalnych. Roczny przegląd zdrowia publicznego 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17
Greenland S. Wprowadzenie do zmiennych instrumentalnych dla epidemiologów. International Journal of Epidemiology 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722
Zohoori N, Savitz DA. Podejścia ekonometryczne do danych epidemiologicznych: Powiązanie endogeniczności i nieobserwowanej heterogeniczności z myleniem. Annals of Epidemiology 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9
Poleciłbym również rozdział 4:
źródło
Oto kilka slajdów, które przygotowałem na kurs ekonometryczny na UC Berkeley. Mam nadzieję, że uznasz je za przydatne --- Wierzę, że odpowiadają na twoje pytania i podają kilka przykładów.
Istnieją również bardziej zaawansowane metody leczenia na stronach kursów dla PS 236 i PS 239 (kursy metod polityki politycznej) na mojej stronie: http://gibbons.bio/teaching.html .
Charlie
źródło
Nietechniczne (zazwyczaj i tak na to i tak jestem dobry): Są chwile, kiedy X nie tylko powoduje Y, ale Y również powoduje X. Zmienna instrumentalna to urządzenie, które może „wyczyścić” tę niechlujną, niewygodną relację, aby można było jak najlepiej oszacować wpływ X na Y.
Zmienna instrumentalna jest wybierana na podstawie jej zależności: jest przyczyną X, ale poza działaniem przez X, nie ma wpływu na Y. Instrument (lub instrumenty) jest używany w Etapie Pierwszym do obliczenia nowej „wersji” „X, który w żaden sposób nie jest funkcją Y. Ten nowy„ przewidywany ”X jest następnie używany w drugim etapie, w bardziej standardowej regresji, w celu wyjaśnienia / przewidywania Y. Stąd termin„ dwuetapowa regresja najmniejszych kwadratów ” .
Zazwyczaj IV znajduje się w procesach, które są nadrzędne lub poza kontrolą X LUB Y, takie jak zmienne zależne od praw, zasad, aktów natury itp.
źródło