Zredukowana forma modelu ekonometrycznego, problem identyfikacyjny i test

7

Poszukuję pomocy w zrozumieniu następującego problemu i korzystania ze zredukowanej formy w ekonometrii

Rozważ model zdrowia jednostki:

health=b0+(b1)age+(b2)weight+(b3)height+(b4)male+(b5)work+(b6)exercise+u

załóżmy, że wszystkie zmienne w równaniu, z wyjątkiem ćwiczenia, są nieskorelowane zu.

A) Zapisz zredukowaną formę do ćwiczeń i określ warunki, w których identyfikowane są parametry równania.

B) W jaki sposób można przetestować założenie dotyczące identyfikacji w części c?


Czy słusznie jest założyć:

exercise=b0+(b1)age+(b2)weight+(b3)height+(b4)male+(b5)work+u
jako forma zredukowana?

i jest warunkiem prostej identyfikacji parametrów

E(exercise|u)=0

i jak mogę to przetestować? Ale do czego to dobrze?

Clemente Cortile
źródło

Odpowiedzi:

3

To jest bardzo standardowe pytanie dotyczące zmiennych instrumentalnych modeli liniowych z jednym równaniem. Biorąc pod uwagę prymitywy twojego pytania, jedyną zmienną endogenną jest ćwiczenie . Aby odpowiedzieć na to konkretne pytanie, potrzebujesz zmiennej egzogenicznej, z , która spełnia dwa warunki:

  1. cov (z, u) = 0.
  2. Musi istnieć związek między zmienną endogenną a tą zmienną egzogeniczną, którą proponujesz, ale że nie była ona częścią prawdziwego modelu postulowanego (modelu strukturalnego). Innymi słowy,
    mixmirdojasmi=β0+β1zasolmi+β2)wmijasolht+β3)hmijasolht+β4mzalmi+β5work+ϕz+εmixmirdojasmi
    z ϕ0, mi(εmixmirdojasmi)=0i prostopadły do ​​wszystkich zmiennych objaśniających (innych niż ćwiczenie) i do.

Przed przejściem dalej uwaga. Przez model strukturalny rozumiem, zgodnie z konwencją Wooldridge'a i Goldbergera, model postulowany. To znaczy model określający związek przyczynowy między zdrowiem a twoimi współzmiennymi. Jest to kluczowa różnica i brak zgody w stosunku do poprzednich odpowiedzi.

Wracając do omawianego problemu, warunek 2 jest tym, co w literaturze równań równań nazywane jest równaniem formy zredukowanej , które jest niczym innym jak liniowym rzutem endogenicznym na wszystkie zmienne egzogeniczne, w tym z.

Teraz podłącz zredukowaną formę do postulowanego modelu, a dostaniesz

hmizalth=α0+α1zasolmi+α2)wmijasolht+α3)hmijasolht+α4mzalmi+α5work+δz+ν
gdzie αja=bja+b6βja,ja{1,,5}, δ=b6ϕ i ν=u+b6εmixmirdojasmi. Z definicji rzutu liniowegoν jest nieskorelowany ze wszystkimi zmiennymi objaśniającymi, a zatem OLS tego ostatniego równania da spójne oszacowania dla αja i δ, a nie podstawa bja w prawdziwym modelu.

Identyfikacja wymaga nieco manipulacji w formie matrycy, ale zasadniczo sprowadza się do tak zwanego warunku rangi . Definiowaćb=(b0,,b6) i x=(1,zasolmi,,mixmirdojasmi) tak aby Twój model konstrukcyjny był hmizalth=xb+u. Teraz zdefiniujz(1,zasolmi,,work,z). Według warunku 1 (cov (z, u) = 0, tak że E (z, u) = 0),

mi(zu)=0
Jeśli pomnożysz dolne boki modelu konstrukcji przez z i weź swoje oczekiwania
mi(zx)b=mi(zy)
Stan warunku stwierdza, że mi(zx)to pełna pozycja w kolumnie. W tym konkretnym przykładzie i podanych warunkach na z jest to równoważnerzank(mi(zx)=6. Dlatego mamy 6 równań w 6 niewiadomych. Dlatego istnieje unikalne rozwiązanie dla systemu, tjb jest zidentyfikowany i równy [mi(zx)]-1mi(zy), zgodnie z życzeniem.

Uwagi: Warunek 1 jest przydatny, aby uzyskać warunek momentu, ale model o zmniejszonej formie z ϕma kluczowe znaczenie dla stanu rangi. Oba warunki są normalne.

W tym momencie powinno być jasne, dlaczego tego potrzebujemy. Z jednej strony, bez z OLS estymator prawdziwego modelu wytworzy niespójne estymatory nie tylko dlab6 ale dla wszystkich bja. Z drugiej strony (i do pewnego stopnia spokrewnione) nasze parametry są jednoznacznie identyfikowane, więc jesteśmy pewni, że szacujemy prawdziwy związek przyczynowy, jak stwierdzono w naszym prawdziwym modelu.

W odniesieniu do testowania warunek 2 (z i ćwiczenia są częściowo skorelowane) można przetestować bezpośrednio i zawsze należy zgłosić ten krok wbrew komentarzowi w poprzedniej odpowiedzi. Istnieje ogromna literatura związana z tym krokiem, szczególnie literatura na temat słabych instrumentów.

Drugi warunek nie może być jednak bezpośrednio przetestowany. Czasami możesz powołać się na teorię ekonomiczną, aby uzasadnić lub przedstawić alternatywne hipotezy, które wspierają użycie z.

MauOlivares
źródło
3

Pytanie to nie ma dla mnie większego sensu, jak powiedziano. Jeśli problem mówi, że ćwiczenia są endogeniczne (skorelowane z terminem błędu), nie można założyć czegoś przeciwnego w rozwiązaniu. Plus, zwykle mówi się o formie zredukowanej vs. strukturalnej w kontekście oszacowania IV. Jeśli ćwiczenia są endogenne, potrzebujesz do tego instrumentu (zmienna, która przewiduje ćwiczenia, ale nie wpływa na zdrowie w inny sposób), aby uzyskać efekty przyczynowe. Na przykład, jeśli niektóre osoby w Twojej próbie losowo wygrały kupony członkowskie na siłownię, może to być ważny instrument.

Wówczas byłyby założenia do identyfikacji

  1. kupon naprawdę przewiduje ćwiczenie

  2. kupon jest prostopadły dou

Tak zwana forma strukturalna to dwa równania, jeden oryginalny model, drugi regresja ćwiczenia na kuponie i inne zmienne objaśniające z oryginalnego modelu (pierwszy etap). Zredukowana forma miałaby miejsce, gdy podstawisz pierwszy etap w głównym równaniu, więc cofniesz zdrowie na podstawie wieku, wagi, ..., pracy i kuponu (ale nie ćwiczenia , ponieważ zostało to zastąpione). Forma zredukowana jest czasami używana do wyjaśnienia właściwości oszacowania IV, ale AFAIK nie jest zbyt często stosowana w praktyce.

ivansml
źródło