Spójność 2SLS z binarną zmienną endogenną

10

Czytałem, że estymator 2SLS jest nadal spójny nawet z binarną zmienną endogenną ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). W pierwszym etapie zamiast modelu liniowego zostanie uruchomiony model leczenia probitowego.

Czy istnieje formalny dowód na to, że 2SLS jest nadal spójny, nawet jeśli 1. etap jest modelem probit lub logit?

A co jeśli wynik jest również binarny? Rozumiem, że jeśli mamy wynik binarny i binarną zmienną endogeniczną (1. i 2. etap to oba binarne modele probit / logit), naśladowanie metody 2SLS da niespójne oszacowanie. Czy jest na to jakiś formalny dowód? Książka ekonometryczna Wooldridge'a ma pewne dyskusje, ale myślę, że nie ma rygorystycznego dowodu, który wykazywałby niespójność.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

współczynnik p = 1.19984. Prowadzę tylko jedną symulację, ale z dużą próbką.

Vincent
źródło
Nie musisz dodawać link = probit do instrukcji modelu?
Mike Hunter,

Odpowiedzi:

10

Podobne pytanie dotyczy pierwszego etapu probitowego i drugiego etapu OLS. W odpowiedzi podałem link do notatek, które zawierają formalny dowód niespójności tej regresji, która jest formalnie znana jako „regresja zabroniona”, jak to określił Jerry Hausman. Główną przyczyną niespójności pierwszego etapu probit / drugiego etapu OLS jest to, że ani operator oczekiwań, ani operator rzutów liniowych nie przechodzą przez nieliniowy pierwszy etap. Dlatego też dopasowane wartości z pierwszego etapu probit są nieskorelowane z terminem błędu drugiego etapu tylko przy bardzo restrykcyjnych założeniach, które prawie nigdy nie mają zastosowania w praktyce. Pamiętaj jednak, że formalny dowód niespójności zakazanej regresji jest dość skomplikowany, jeśli dobrze pamiętam.

Yja=α+βXja+ϵja
YjaXja
Xja=za+Zjaπ+ηja
X^jaXjaXja


Yja

Bardziej szczegółowe omówienie tego znajduje się w doskonałych notatkach wykładowych Kit Baum na ten temat. Ze slajdu 7 omawia wykorzystanie liniowego modelu prawdopodobieństwa w kontekście 2SLS.

Wreszcie, jeśli naprawdę chcesz użyć probit, ponieważ chcesz bardziej wydajnych szacunków, istnieje inny sposób, o którym wspomniano również w Wooldridge (2010) „Analiza ekonometryczna danych przekroju i panelu”. Powyższa połączona odpowiedź zawiera ją, powtarzam ją tutaj dla kompletności. Jako zastosowany przykład patrz Adams i in. (2009), którzy stosują trzyetapową procedurę, która wygląda następująco:

  1. użyj probit, aby regresować zmienną endogenną na instrumencie (instrumentach) i zmienne egzogeniczne
  2. zastosować przewidywane wartości z poprzedniego kroku w pierwszym etapie OLS wraz ze zmiennymi egzogennymi (ale bez instrumentów)
  3. wykonaj drugi etap jak zwykle

Ta procedura nie jest objęta problemem niedozwolonej regresji, ale potencjalnie zapewnia bardziej wydajne oszacowanie interesującego cię parametru.

Andy
źródło
Cześć Andy, dziękuję za odpowiedź. Czy sugerujesz „niespójność pierwszego etapu probit / OLS drugiego etapu”? Nie tego czytałem w linku, który podałem. Mówi się, że podejście do pierwszego etapu Probit / OLS jest spójne.
Vincent
Nie tak mówi post Statalist. Jeśli spojrzysz na sekcję „metody i formuły” dla polecenia Treatreg (która jest teraz nazywana etregress) w dokumentacji , zobaczysz, że estymator 2-etapowy nie jest 2SLS z pierwszym etapem probit / drugim etapem OLS. Zamiast tego najpierw stosuje się probit w celu uzyskania współczynników ryzyka, które następnie stosuje się w regresji OLS w celu uzyskania spójnych szacunków.
Andy
Dzięki, Andy. Robi się interesująco. Wygląda naśladowanie 2SLS z modelem probit w 1. etapie nie jest akceptowane. Przeczytam „zakaz regresji” z przyczyn teoretycznych. Nawiasem mówiąc, próbowałem symulacji przy użyciu SAS i wyniki nie wyglądają źle dla 2SLS z probit 1st / ols 2nd.
Vincent
Publikuję kod w głównym pytaniu i chciałbym usłyszeć wasze komentarze. Dzięki!
Vincent