Mam podłużny zestaw danych osób, a niektóre z nich zostały poddane leczeniu, a inne nie. Wszystkie osoby są w próbie od urodzenia do 18 roku życia, a leczenie odbywa się w pewnym wieku pomiędzy tym zakresem. Wiek leczenia może się różnić w zależności od przypadku. Korzystając z dopasowywania wyników skłonności, chciałbym dopasować pary traktowane i kontrolne parami z dokładnym dopasowaniem w roku urodzenia, tak że mogę śledzić każdą parę od ich urodzenia do 18 roku życia. W sumie jest około 150 leczonych i 4000 nieleczonych osób. Po dopasowaniu pomysł polega na zastosowaniu strategii różnic w różnicach, aby oszacować efekt leczenia.
Problem, z którym się teraz spotykam, polega na dopasowaniu danych panelu. Korzystam z psmatch2
polecenia Staty i dopasowuję cechy gospodarstwa domowego i cechy indywidualne, stosując dopasowanie skłonności. Zasadniczo z danymi panelowymi będą różne optymalne dopasowania w każdym wieku. Na przykład: jeśli A jest traktowane, B i C są kontrolami, a wszystkie z nich urodziły się w 1980 r., A i B można dopasować w 1980 r. W wieku 0, podczas gdy A i C są dopasowane w 1981 r. W wieku 1 i tak dalej . Również A można dopasować do własnych wartości sprzed obróbki z poprzednich lat.
Aby obejść ten problem, wziąłem średnią wszystkich zmiennych zmieniających się w czasie, dzięki czemu dopasowanie może zidentyfikować osoby, które są średnio najbardziej podobne w czasie trwania próby, i dopasowuję osobno dla każdej grupy wiekowej od 0 do 18 lat. Niestety, to wciąż dopasowuje inną jednostkę kontrolną do każdej leczonej jednostki w grupie wiekowej.
Gdyby ktoś skierował mnie w stronę metody dopasowania parami z danymi panelu w Stacie, byłoby to bardzo mile widziane.
Nie ma takiej możliwości w Stacie ani żadnym innym oprogramowaniu, o którym wiem.
Jeśli próbujesz załatać tendencyjne dopasowanie estymatora za pomocą technik danych panelowych, oto jedno podejście, które może działać. Jeśli możesz założyć, że dopasowywanie zajmuje się niektórymi, ale nie wszystkimi stronniczościami selekcji, ale że tendencyjność w dużej mierze pozostaje stała w czasie, możesz usunąć niezmienną czasowo część tendencyjności, konstruując osobne szacunkowe dopasowania w każdym okresie i biorąc różnica.
Niech będzie okresem wstępnego leczenia, a będzie pocztą. Jeśli wynik stanu nietraktowanego zadowalającyt t′ Y0
Artykuły Heckman, Ichimura, Smith i Todd 1998 Econometrica oraz Eichler i Lechner 2002 Labor Economics są przykładami tego podejścia. Z drugiej strony 150 leczonych obserwacji może nie wystarczyć do tego podejścia.
źródło
Kroki:
Jak szczegółowo wspomniał Greg, do wygenerowania dopasowania można użyć przekrojowego zestawu danych, dotyczącego środków obróbki wstępnej lub określonego okresu obróbki wstępnej.
Za pomocą całego panelu przypisujesz zmienne wskaźnikowe dla
a. traktowane indywidualnie
b. traktowany okres, ten ostatni jest równy zeru, gdy tylko nastąpi leczenie dla leczonej osoby.
Ponieważ moment, w którym leczony okres zmienia się od 0 do 1, różni się u poszczególnych osób i nigdy nie zmienia się na 1 dla nieleczonego, musisz przypisać ten sam punkt początkowy od leczonego dopasowania do nieleczonego dopasowania. Jest to intuicyjne, ale nadal chciałbym zobaczyć dobre referencje uzasadniające to podejście, którego do tej pory nie znalazłem.
Konfiguracja regresji byłaby następująca:
gdzie termin interakcji daje efekt leczenia.
źródło
Czy rozważałeś użycie polecenia nnmatch ?
Używam tego polecenia i jest ono dość obszerne. Uwzględnia różne algorytmy dopasowania, a także przypadki, w których wynik skłonności jest taki sam dla niektórych osób z grupy kontrolnej. Oczywiście, leczenie tego przypadku zależy od algorytmu dopasowywania, jeśli weźmiesz k-najbliższego sąsiada, jądro lub cokolwiek innego.
źródło