2SLS, ale drugi etap Probit

15

Próbuję użyć analizy zmiennych instrumentalnych do wnioskowania o przyczynowości na podstawie danych obserwacyjnych.

Natknąłem się na dwustopniową regresję metodą najmniejszych kwadratów (2SLS), która prawdopodobnie rozwiąże problem endogeniczności w moich badaniach. Chciałbym jednak, aby pierwszy etap był OLS, a drugi etap probit w ramach 2SLS. Opierając się na moich lekturach i poszukiwaniach, zauważyłem, że badacze używają albo 2SLS, albo pierwszego etapu probit i drugiego etapu OLS, ale nie na odwrót, co staram się osiągnąć.

Obecnie używam Stata i polecenie ivreg w Stata jest dla prostej 2SLS.

Weronika
źródło

Odpowiedzi:

12

Twoja sprawa jest mniej problematyczna niż na odwrót. Operatory oczekiwań i projekcji liniowych przechodzą przez liniowy pierwszy etap (np. OLS), ale nie przez nieliniowe, takie jak probit lub logit. Dlatego nie jest problemem, jeśli najpierw regresujesz ciągłą zmienną endogenną na swoim instrumencie (instrumentach) , a następnie użyjesz dopasowanych wartości w drugim etapie probit do oszacowania Z X i = a + Z ' i gatunku + η i Pr ( Y i = 1 | X I ) = Pr ( β X i + ε i > 0 )XZ

Xja=za+Zjaπ+ηja
Par(Yja=1|X^ja)=Par(βX^ja+ϵja>0)

Standardowe błędy nie będą właściwe, ponieważ nie jest zmienną losową, ale wielkością szacunkową. Możesz to naprawić, ładując jednocześnie pierwszy i drugi etap. W Stacie byłoby to coś w rodzajuX^ja

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

W tym przykładzie chcemy oszacować wpływ lat edukacji na prawdopodobieństwo bycia w związku zawodowym. Biorąc pod uwagę fakt, że lata edukacji mogą być endogeniczne, przygotowujemy je na lata stażu w pierwszym etapie. Oczywiście nie ma to sensu z punktu widzenia interpretacji, ale ilustruje kod.

Tylko upewnij się, że używasz tych samych egzogennych zmiennych kontrolnych zarówno w pierwszym, jak i drugim etapie. W powyższym przykładzie są to, age, racepodczas gdy (niesensowny) instrument tenurejest tylko w pierwszym etapie.

Andy
źródło
Dzięki bardzo, to rozwiązało problem, z którym się spotkałem. Dzięki jeszcze raz.
Veronica,
1
W rzeczywistości badania sugerują zastosowanie podejścia z funkcją kontroli dla modeli nieliniowych, takich jak logit, które polegałyby na wykorzystaniu reszt z pierwszego etapu wraz ze zmienną endogenną zamiast wartości przewidywanych. Chociaż często zdarzają się postępy, patrz: stat.wharton.upenn.edu/~zijguo/…
robin.datadrivers
1
Przepraszam, nie podałem cytatu na temat porównania dwóch podejść do modeli liniowych i nieliniowych. ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers
-1 Musiałem głosować za odpowiedzią, ponieważ generalnie nie jest możliwe przeniesienie idei estymatora 2SLS do modeli nieliniowych w pierwszym i / lub drugim etapie. To może być prawda w przypadku 1. etapu LS i 2. etapu probit (@Andy, czy masz odniesienie do poparcia tego?), Ale przynajmniej zastrzeżenie jest w porządku, ponieważ widziałem wiele osób wykonujących ideę 2SLS na różne sposoby przypadków modeli nieliniowych w pierwszym i drugim etapie i jest to problematyczna praktyka.
Momo