Pracuję w ekonomii politycznej, a wiele modeli obejmuje „niewinne” zmienne kontrolne, takie jak populacja, nierówność, dziedzictwo kolonialne itp., Aby autor mógł domagać się bezstronności w stosunku do swojej niezależnej zmiennej zainteresowania.
Ale jeśli którakolwiek z tych zmiennych kontrolnych jest endogenna dla jakiejś pominiętej zmiennej, czy nie narusza to bezstronności WSZYSTKICH zmiennych niezależnych?
Jeśli to prawda, co możemy zrobić? Pozostaw te zmienne kontrolne wyłączone, a one same prowadzą do pomijania zmiennych zmiennych. Uwzględnij te w, a one zanieczyszczą wszystko w modelu.
Przykład: badacz chce wiedzieć, czy nierówność prowadzi do przemocy, i kontroluje kilka rzeczy: Widząc, że nierówność może być endogeniczna (z powodu pominiętej zmiennej Poziom altruizmu
Ten przykład może wyglądać głupio, ale moja uwaga dotyczy prac nad ekonomią polityczną / rozwojem, istnieje tak wiele czynników (jeszcze pominiętych), że obawiam się, że wiele zmiennych zawartych w LHS jest endogennych. Jednak często badacz szuka tylko instrumentu dla swojej zmiennej niezależnej dla zwierzaka.
źródło
Odpowiedzi:
„Ale jeśli którakolwiek z tych zmiennych kontrolnych jest endogenna dla jakiejś pominiętej zmiennej, czy nie narusza to bezstronności WSZYSTKICH zmiennych niezależnych?”
Nie chcę tego zbyt mocno podkreślać, ale warto wspomnieć, że nie jest to w ogóle prawda. Poniższe wyprowadzenie, miejmy nadzieję, zapewni pewne zrozumienie wspomnianego „zanieczyszczenia”. Jako prosty kontrprzykład załóżmy, że proces generowania danych jest określony przez gdzie Z nie jest obserwowane. Niech C o v ( X 1 , Z ) = 0 , C o v ( X 2
"Co możemy zrobić?"
Jednym z głównych wyzwań robienia dobrych ekonometrii jest myślenie o potencjalnych strategiach identyfikacji. W opisywanej sytuacji prawdopodobnie nic nie można zrobić, prócz podejścia do problemu w inny sposób.
źródło
Wszystko jest zbyt silne, ale prawdopodobnie niektóre. Ten problem nazywa się „rozmazywaniem”. Spójrz na dowód w notatkach Greene'a na slajdzie 5.
Emily Oster ma fajny dokument roboczy (i polecenie Stata
psacalc
), które mogą pomóc ograniczyć błąd.źródło
W kontekście estymacji metodą najmniejszych kwadratów sposób, w jaki musimy (próbować) radzić sobie z możliwą endogenicznością regresorów, polega na estymacji zmiennych instrumentalnych. To podejście nie zależy od posiadania tylko jednego endogennego regresora - możesz mieć wiele. W takim przypadku musisz oczywiście znaleźć więcej instrumentów, które utrudniają pracę - ale w zasadzie metoda będzie działać w ten sam sposób.
Oszacowanie IV nie rozwiązuje problemu uprzedzeń, zapewnia jedynie spójność estymatora. Ale nic nie rozwiązuje problemu samej ścisłej egzogeniczności (a następnie istnieją pewne metody redukcji uprzedzeń). Ale jeśli rozejrzysz się po innej witrynie SE, Cross Validated , która dotyczy statystyk, zobaczysz, że doświadczeni statystycy nie przywiązują dużej wagi do właściwości bezstronności - skupiają się na efektywności średniej kwadratowej dla skończonych właściwości próbki, i konsystencji dla właściwości dużych próbek.
źródło
Jest to przykład tego, co statystyka Andrew Gelman nazywa „błędem kontrolowania w celu uzyskania efektu pośredniego”. Oto jego opis tego błędu pojawiającego się, gdy badacze pytają, czy posiadanie większej liczby córek zmienia twoją politykę. Decyzja o posiadaniu drugiego dziecka jest z konieczności uzależniona od poprzedniej decyzji o posiadaniu pierwszego dziecka, a zatem wydaje się, że jest to wyraźny przykład kontrolowania endogenicznej zmiennej decyzyjnej.
Czy posiadanie synów czyni cię bardziej konserwatywnym? Może, może nie. Problem z kontrolowaniem wyniku pośredniego
Jeśli chodzi o twój komentarz: „Pozostaw te zmienne kontrolne na zewnątrz, a one same prowadzą do pomijania zmiennych zmiennych”, wydaje się, że zależy to od tego, jaki rodzaj instrumentu otrzymujesz. Dobry instrument, taki, który naprawdę spełnia wymagania, musi być niezależny od warunku błędu w drugim etapie i niezależny od wszystkiego, nad czym bezpośrednio kontrolujesz . Oznacza to, że instrument zmienia Y tylko przez X. Zatem odpowiedni instrument nierówności musi być niezależny od wzrostu i rozwoju (powodzenia w znalezieniu tego!), Jeśli uważamy, że równanie przemocy jest równaniem strukturalnym przemocy.
źródło
Jak zauważyły inne posty, endogenne regresory mogą zanieczyścić wszystkie oszacowania parametrów regresji, gdy regresory są skorelowane.
Rozważ następujący model (analogiczny do notacji @ jmbejara)
Teraz, jeśli jest endogenny, ale nie oznacza, że cała korelacja między i zniknie po kontroli dlaX2 X1 X1 Z X2 , tj.
X1X2
źródło