Rozumiem, że podstawowa definicja endogeniczności jest taka, że nie jest spełniony, ale co to oznacza w sensie realnym? Czytam artykuł z Wikipedii, na przykład podaży i popytu, próbując to zrozumieć, ale to naprawdę nie pomogło. Słyszałem inny opis endogennego i egzogennego jako bycia w systemie i bycia poza nim, a to wciąż nie ma dla mnie sensu.
regression
causality
instrumental-variables
użytkownik25901
źródło
źródło
R
.Odpowiedzi:
Odpowiedź JohnRos jest bardzo dobra. Mówiąc wprost, endogeniczność oznacza, że przyczyna jest błędna. To, że model, który zanotowałeś i oszacowałeś, nie oddaje w prawidłowy sposób związku przyczynowego w prawdziwym świecie. Kiedy piszesz:
możesz pomyśleć o tym równaniu na wiele sposobów. Można to uznać za wygodny sposób przewidywania na podstawie wartościMożna to uznać za wygodny sposób modelowania . W obu tych przypadkach nie ma czegoś takiego jak endogeniczność i nie musisz się tym martwić.X E { Y | X }Y X E{Y|X}
Można jednak również traktować to równanie jako ucieleśnienie związku przyczynowego. Możesz pomyśleć o jako odpowiedzi na pytanie: „Co by się stało z gdybym sięgnął do tego systemu i eksperymentalnie zwiększył o 1?” Jeśli chcesz myśleć o tym w ten sposób, użycie OLS do oszacowania sprowadza się do założenia, że: Y Xβ1 Y X
Niepowodzenie któregokolwiek z 3-5 spowoduje ogólnie , lub, nie całkiem równoważnie, . Zmienne instrumentalne są sposobem na skorygowanie faktu, że przyczyna jest błędna (poprzez przyjęcie innego, odmiennego, przyczynowego założenia). Doskonale przeprowadzona randomizowana, kontrolowana próba jest sposobem na wymuszenie 3-5. Jeśli wybierzesz losowo, to na pewno nie jest to spowodowane przezC o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0 Cov(X,ϵ)≠0 X Y , lub cokolwiek innego. Tak zwane metody „naturalnego eksperymentu” to próby znalezienia specjalnych okoliczności na świecie, w których 3-5 jest prawdziwe, nawet jeśli nie uważamy, że 3-5 są prawdziwe.ϵ
W przykładzie JohnRos, aby obliczyć wartość płacy w edukacji, potrzebujesz przyczynowej interpretacji , ale istnieją dobre powody, by sądzić, że 3 lub 5 jest fałszywe.β1
Twoje zamieszanie jest jednak zrozumiałe. Jest to bardzo typowe podczas kursów na modelu liniowym, gdy instruktor stosuje interpretację przyczynowąβ1 który podałem powyżej, udając, że nie wprowadza związku przyczynowego, udając, że „wszystko to tylko statystyki”. To tchórzliwe kłamstwo, ale jest również bardzo powszechne.
W rzeczywistości jest częścią większego zjawiska w biomedycynie i naukach społecznych. Prawie zawsze jest tak, że próbujemy określić przyczynowo-skutkowy wpływ na - o to przecież chodzi w nauce. Z drugiej strony prawie zawsze zdarza się, że istnieje pewna historia, która prowadzi do wniosku, że jedna z 3-5 jest fałszywa. Istnieje więc rodzaj praktykowanej, płynnej, ekscytującej nieuczciwości, w której usuwamy obiekcje, mówiąc, że wykonujemy pracę związaną z stowarzyszeniem, a następnie przekradamy interpretację przyczynową z powrotem w innym miejscu (zwykle we wstępie i końcowych rozdziałach artykułu).YX Y
Jeśli jesteś naprawdę zainteresowany, facetem do przeczytania jest Judea Perl. James Heckman jest także dobry.
źródło
Pozwól mi skorzystać z przykładu:
Powiedz, że chcesz obliczyć (przyczynowy) wpływ edukacji na dochód. Bierzesz lata edukacji i dane o dochodach i regresujesz jeden względem drugiego. Czy odzyskałeś to, czego chciałeś? Prawdopodobnie nie! Wynika to z faktu, że dochód jest również spowodowany przez rzeczy inne niż edukacja, ale które są skorelowane z edukacją. Nazwijmy je „umiejętnościami”: możemy bezpiecznie założyć, że na „lata nauki” wpływa „umiejętność”, ponieważ im wyższy poziom umiejętności, tym łatwiej zdobyć wykształcenie. Jeśli więc cofniesz lata edukacji do dochodu, estymator efektu edukacji absorbuje efekt „umiejętności” i otrzymujesz zbyt optymistyczne oszacowanie powrotu do edukacji. Oznacza to, że wpływ edukacji na dochód jest (w górę) tendencyjny, ponieważ edukacja nie jest egzogeniczna w stosunku do dochodów.
źródło
User25901 szuka prostego, prostego wyjaśnienia w świecie rzeczywistym, co oznaczają pojęcia egzogeniczny i endogeniczny. Odpowiadanie na tajemne przykłady lub definicje matematyczne tak naprawdę nie odpowiada na zadane pytanie.
Jak mogę w pełni zrozumieć te dwa terminy?
Oto, co wymyśliłem:
Exo - zewnętrzny, zewnętrzny Endo - wewnętrzny, wewnętrzny - genialny - pochodzący z
Egzogeniczny: Zmienna jest egzogeniczna dla modelu, jeśli nie jest określona przez inne parametry i zmienne w modelu, ale jest ustawiona na zewnątrz, a wszelkie zmiany w niej wynikają z sił zewnętrznych.
Endogeniczny: zmienna jest endogenna w modelu, jeśli przynajmniej częściowo jest funkcją innych parametrów i zmiennych w modelu.
źródło
To dwa etapy najmniejszych kwadratów, które są prawie takie same jak IV.
źródło
W regresji chcemy uchwycić ilościowy wpływ zmiennej niezależnej (która, jak zakładamy, jest egzogenna i nie jest zależna od czegoś innego) na zidentyfikowaną zmienną zależną. Chcemy wiedzieć, jaki wpływ netto ma zmienna egzogeniczna na zmienną zależną, co oznacza, że zmienna niezależna powinna być wolna od jakiegokolwiek wpływu innej zmiennej. Szybkim sposobem sprawdzenia, czy regresja cierpi na problem endogeniczności, jest sprawdzenie korelacji między zmienną niezależną a resztami. Ale to tylko zgrubna kontrola, w przeciwnym razie należy przeprowadzić formalne testy endogeniczności.
źródło