Która konfiguracja jest poprawna dla używanego modelu regresji różnicowej
gdzie T jest manekinem, który jest równy 1, jeśli obserwacja pochodzi z grupy badanej, a d jest manekinem, który jest równy 1 w okresie po wystąpieniu leczenia
1) Losowe próbki z każdej grupy i czasu (tj. 4 losowe próbki)
lub
2) Dane paneli, w których te same jednostki są śledzone w obu okresach?
Czy to ma znaczenie, a jeśli nie, czy można używać OLS w obu przypadkach?
Odpowiedzi:
Kluczowym założeniem różnic w różnicach (DID) jest to, że obie grupy mają wspólny trend w zmiennej wyniku przed leczeniem. Jest to ważne, aby wysunąć argument, że zmiana dla leczonej grupy wynika z leczenia, a nie dlatego, że dwie grupy były już na początku różne od siebie.
Jeśli pobierzesz próbki od różnych osób przed i po zabiegu, osłabi to argument, chyba że próbki z grup poddanych leczeniu i grupie kontrolnej są w rzeczywistości losowe i duże. Więc może się zdarzyć, że ktoś zapyta cię: „Jak możesz upewnić się, że efekt jest spowodowany leczeniem, a nie tylko dlatego, że pobrałeś próbki od różnych osób?” - i trudno będzie na nie odpowiedzieć. To pytanie można uniknąć, wykorzystując dane panelowe, ponieważ tam śledzisz te same jednostki statystyczne w czasie i ogólnie jest to bardziej solidne podejście.
Aby odpowiedzieć na ostatnie pytanie: tak, dane są ważne, ale z pewnością możesz użyć OLS do oszacowania powyższego równania. Ważną rzeczą, która w przeszłości była często pomijana, jest prawidłowe oszacowanie standardowych błędów. Jeśli ich nie poprawisz, korelacja szeregowa zlekceważy je o dobrą kwotę i znajdziesz znaczące efekty, nawet jeśli prawdopodobnie nie powinieneś. Jako odniesienie i sugestie dotyczące radzenia sobie z tym problemem patrz Bertrand i in. (2004) „Jak bardzo powinniśmy ufać szacunkom różnic w różnicach?” .
Na koniec, jeśli masz agregowane dane (np. Na poziomie stanu) lub jeśli możesz łatwo agregować swoje i jeśli chcesz użyć nowszej metody ekonometrycznej niż DID, możesz rzucić okiem na Abadie i in. (2010) „Syntetyczne metody kontroli w porównawczych studiach przypadków” . Syntetyczna metoda kontroli jest coraz częściej stosowana w dzisiejszych badaniach i istnieją dobrze udokumentowane procedury dla R i Staty. Może to również jest dla ciebie interesujące.
źródło