Różnica różnic od dawna jest popularna jako narzędzie nie eksperymentalne, zwłaszcza w ekonomii. Czy ktoś może udzielić jasnej i nietechnicznej odpowiedzi na następujące pytania dotyczące różnic w różnicach.
Co to jest estymator różnicy w różnicach?
Dlaczego estymator różnicy w różnicach jest wykorzystywany?
Czy rzeczywiście możemy ufać szacunkom różnic w różnicach?
regression
econometrics
difference-in-difference
Graham Cookson
źródło
źródło
Odpowiedzi:
Czym jest estymatorDi Yi
różnic w różnicach Różnica w różnicach (DiD) jest narzędziem do oszacowania efektów leczenia, porównując różnice przed i po leczeniu w wyniku leczenia i grupy kontrolnej. Ogólnie rzecz biorąc, jesteśmy zainteresowani oszacowaniem wpływu leczenia (np. Status związku, leki itp.) Na wynik (np. Płace, zdrowie itp.) Jak w gdzie to indywidualne ustalone efekty (cechy jednostek, które nie zmieniają się w czasie), to efekty ustalone w czasie, to zmienne towarzyszące w czasie, takie jak wiek poszczególnych osób i
Aby zobaczyć efekt leczenia, chcielibyśmy poznać różnicę między osobą w świecie, w którym otrzymywała leczenie, a tym, w którym nie. Oczywiście tylko jeden z nich można zaobserwować w praktyce. Dlatego szukamy osób z tymi samymi trendami w zakresie wstępnego leczenia w wyniku. Załóżmy, że mamy dwa okresy i dwie grupy . Następnie, przy założeniu, że trendy w grupach leczenia i kontrolnej byłyby kontynuowane w taki sam sposób jak poprzednio w przypadku braku leczenia, możemy oszacować efekt leczenia jakot=1,2 s=A,B
Graficznie wyglądałoby to mniej więcej tak:
Możesz po prostu obliczyć te środki ręcznie, tj. Uzyskać średni wynik grupy w obu okresach i przyjąć różnicę. Następnie uzyskaj średni wynik grupy w obu okresach i uwzględnij ich różnicę. Następnie weź różnicę w różnicach i to jest efekt leczenia. Jednak wygodniej jest to zrobić w ramach regresji, ponieważ pozwala to na toA B
Aby to zrobić, możesz zastosować jedną z dwóch równoważnych strategii. Wygeneruj atrapę grupy kontrolnej która jest równa 1, jeśli dana osoba jest w grupie a w przeciwnym razie 0, wygeneruj atrapę czasu która jest równa 1, jeśli a w przeciwnym razie 0, a następnie regresujtreati A timet t=2
Lub po prostu generujesz manekina który jest równy jeden, jeśli dana osoba jest w grupie leczenia ORAZ okres czasu jest okresem po leczeniu i w przeciwnym razie wynosi zero. PotemTit
gdzie jest znów atrapą dla grupy kontrolnej, a to manekiny czasu. Dwie regresje dają te same wyniki dla dwóch okresów i dwóch grup. Drugie równanie jest jednak bardziej ogólne, ponieważ łatwo rozciąga się na wiele grup i okresów. W obu przypadkach można w ten sposób oszacować parametr różnicy różnic w taki sposób, aby można było uwzględnić zmienne kontrolne (pominąłem te z powyższych równań, aby ich nie zaśmiecać, ale można je po prostu uwzględnić) i uzyskać standardowe błędy do wnioskowania.γs λt
Dlaczego przydatny jest kalkulator różnic w różnicach?E(Y0it|i,t)=αi+λt E(Y0it|s,t)=γs+λt s
Jak stwierdzono wcześniej, DiD jest metodą szacowania efektów leczenia za pomocą danych nie eksperymentalnych. To najbardziej przydatna funkcja. DiD jest także wersją estymacji efektów stałych. Podczas gdy model efektów stałych zakłada , DiD przyjmuje podobne założenie, ale na poziomie grupy, . Zatem oczekiwaną wartością wyniku jest tutaj suma efektu grupy i czasu. Jaka jest różnica? Dla skończyłeś nie muszą danych panelowych o ile swoich wielokrotnych przekrojach pochodzą z tej samej jednostki kruszywo . To sprawia, że DiD ma zastosowanie do szerszego zakresu danych niż standardowe modele efektów stałych, które wymagają danych panelowych.
Czy możemy ufać różnicy różnic?
Najważniejszym założeniem w DiD jest założenie trendów równoległych (patrz rysunek powyżej). Nigdy nie ufaj badaniu, które nie pokazuje graficznie tych trendów! Dokumenty z lat 90. XX wieku mogły się z tym pogodzić, ale obecnie nasze rozumienie DiD jest znacznie lepsze. Jeśli nie ma przekonującego wykresu pokazującego równoległe trendy w wynikach leczenia wstępnego dla grup leczonych i kontrolnych, należy zachować ostrożność. Jeśli utrzyma się założenie o równoległych trendach i możemy w wiarygodny sposób wykluczyć wszelkie inne zmiany w czasie, które mogą zakłócać leczenie, to DiD jest wiarygodną metodą.
Należy zachować jeszcze jedno ostrzeżenie, jeśli chodzi o traktowanie standardowych błędów. W przypadku wieloletnich danych należy dostosować standardowe błędy autokorelacji. W przeszłości było to zaniedbywane, ale od czasu Bertrand i in. (2004) „Jak bardzo powinniśmy ufać szacunkom różnic w różnicach?” wiemy, że to jest problem. W artykule podają kilka sposobów zaradzenia autokorelacji. Najłatwiej jest skupić się na indywidualnym identyfikatorze panelu, co pozwala na dowolną korelację reszt pomiędzy poszczególnymi szeregami czasowymi. To koryguje zarówno autokorelację, jak i heteroscedastyczność.
Więcej informacji można znaleźć w notatkach z wykładów Waldingera i Pischke .
źródło
Wikipedia ma przyzwoity wpis na ten temat , ale dlaczego po prostu nie zastosować regresji liniowej pozwalającej na interakcje między twoimi niezależnymi zmiennymi będącymi przedmiotem zainteresowania? Wydaje mi się to bardziej zrozumiałe. Następnie możesz przeczytać o analizie prostych nachyleń (w książce Cohena i innych bezpłatnie w Google Books), jeśli twoje zmienne zainteresowania są ilościowe.
źródło
Jest to technika szeroko stosowana w ekonometrii do badania wpływu dowolnego zdarzenia egzogenicznego w szeregu czasowym. Wybierasz dwie oddzielne grupy danych odnoszące się do badanego wydarzenia przed i po nim. Dobrym źródłem informacji, aby dowiedzieć się więcej, jest książka Wprowadzenie do ekonometrii autorstwa Wooldridge.
źródło
Ostrożny:
źródło