Określanie modelu różnic w różnicach z wieloma przedziałami czasowymi

20

Gdy oszacuję model różnic w dwóch przedziałach czasowych, model regresji równoważnej byłby następujący

za. Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • gdzie jest manekinem równym 1, jeśli obserwacja pochodzi z grupy poddanej leczeniuTreatment
  • i jest obojętne, które jest równe 1, w okresie czasu po leczeniu doszłod

Zatem równanie przyjmuje następujące wartości.

  • Grupa kontrolna, przed leczeniem:α
  • Grupa kontrolna, po leczeniu:α+λ
  • Grupa leczenia, przed leczeniem:α+γ
  • Grupa leczenia, po leczeniu: α+γ+λ+δ

Stąd w modelu dwumiesięcznym różnica szacunków różnic wynosi δ .

Ale co się dzieje w sprawie dt , jeśli mam więcej niż jeden okres przed i po zabiegu? Czy nadal używam manekina, który wskazuje, czy rok jest przed czy po zabiegu?

A może zamiast tego dodam manekiny roczne, nie określając, czy każdy rok należy do okresu przed czy po leczeniu? Lubię to:

b. Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

Można I obejmują zarówno (tj )?yeardummy+λdt

do. Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

Podsumowując, jak określić różnicę w modelu różnic z wieloma przedziałami czasowymi (a, b lub c)?

Tomek
źródło
1
Zazwyczaj używasz modelu b. Należy zauważyć, że w modelu o c, będzie idealnie współliniowa z manekinów roku tak, że model nie może być oszacowana. dt
standard_error
Byłoby wspaniale, gdybyś mógł wyjaśnić, dlaczego b jest ogólnie używane. Może podać jakieś odniesienia lub po prostu wyjaśnić 2 zdania.
mpiktas
oraz w modelu b. czy możesz dodać zmienną ciągłą dla roku zamiast manekinów? Czym różni się interpretacja współczynników w tych przypadkach?

Odpowiedzi:

19

Typowym sposobem oszacowania modelu różnic w więcej niż dwóch przedziałach czasowych jest proponowane rozwiązanie b). Utrzymanie zapisu byś regresji w którym D TLeczenie sd t manekina Zmienną wynosi jeden dla jednostek leczenia s

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
DtTreatmentsdtsw okresie po leczeniu ( ) i w przeciwnym razie wynosi zero. Należy zauważyć, że jest to bardziej ogólne sformułowanie regresji różnic w różnicach, które pozwala na różne czasy leczenia dla różnych leczonych jednostek.dt=1

Jak wskazano poprawnie w komentarzach, proponowane rozwiązanie c) nie działa z powodu kolinearności z manekinami i manekinem po okresie leczenia. Jednak niewielki wariant tego okazuje się sprawdzeniem niezawodności. Niech i γ s 1 będą odpowiednio dwoma zestawami zmiennych fikcyjnych dla każdej jednostki kontrolnej s 0 i każdej leczonej jednostki s 1 , a następnie oddziałują na manekiny dla traktowanych jednostek ze zmienną czasową t i regresją Y i s t = γ s 0 + γ s 1 tγs0γs1s0s1t obejmuje trend czasowy właściwy dla jednostki γ s 1 t . Po uwzględnieniu trendów czasowych specyficznych dla jednostki, a różnica współczynników różnic δ nie zmienia się znacząco, możesz być bardziej pewny swoich wyników. W przeciwnym razie możesz się zastanawiać, czy efekt leczenia zaabsorbował różnice między leczonymi jednostkami z powodu trendu leżącego u podstaw (może się zdarzyć, gdy zasady zaczną obowiązywać w różnych momentach).

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
γs1tδ

Przykład cytowany w Angrist i Pischke (2009) Mostly Harmless Econometrics to badanie polityki rynku pracy przeprowadzone przez Besleya i Burgessa (2004) . W ich pracy zdarza się, że włączenie trendów czasowych właściwych dla danego stanu zabija szacowany efekt leczenia. Pamiętaj jednak, że do tej kontroli odporności potrzebujesz więcej niż 3 okresów.

Andy
źródło
Kontynuacja, ponieważ próbuję zdecydować, czy wdrożenie tego przy użyciu niektórych danych administracyjnych jest właściwe: Czy powiedziałbyś, że podejście DD jest ważniejsze niż projekt CITS, jeśli w modelu są tylko 4 punkty czasowe (2 przed i 2 po)? Ponadto, jeśli mam wiele kohort w obrębie fal danych, czy należy je badać osobno czy w ujednoliconym modelu? Dzięki.
bfoste01
@Andy: Czy możesz wyjaśnić, co rozumiesz przez s0, s1 i trend czasowy związany z jednostką? Zakładając, że mam dwie gazety (WPT i NYT), a WPT jest moją grupą terapeutyczną, która z nich to s0 i s1?
user3683131
1
Czy mam rację, sądząc, że ta analiza porównuje średnią przed i po leczeniu i nie uwzględnia świeckich trendów? tzn. jeśli d_t = 0 dla wszystkich przedziałów czasowych przed punktem przełączenia, a d_t = 1 dla wszystkich okresów później, to analiza jest zasadniczo taka sama jak dla dwóch przedziałów czasowych jeden, z tym wyjątkiem, że średnia jest pobierana ze wszystkich czasów przed / po okresy. Jakieś trendy czasowe w wyniku przed / po zmianie leczenia są ignorowane? Próbuję zdecydować, czy model DiD jest odpowiedni do analizy, którą planuję przeprowadzić.
AP30
0

γ1s

Angrist i Pischke (2009) zalecają to podejście na stronie 238 w „ Większość nieszkodliwych ekonometrii” . Różnice w notacji mogą powodować zamieszanie. Powielanie specyfikacji 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

γ0ssγ1st

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

Ds,tstTimet

Specyficzne dla jednostki trendy liniowe czasu są również omówione w innym poście (patrz poniżej):

Jak rozliczać się z umieszczenia programu endogennego?

Podsumowując, chcesz współdziałać ze wszystkimi manekinami jednostkowymi (grupowymi) za pomocą zmiennej trendu ciągłego.

Papier autorstwa Justina Wolfersa znajduje się poniżej w celach informacyjnych:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Tomek
źródło