RDD, płace i dzień urodzenia

1

Co robię: używam modelu regresji nieciągłości (odtąd RDD) do badania różnic w wynagrodzeniach otrzymywanych przez osoby urodzone pod koniec roku i przez osoby urodzone na początku roku. Mam zestaw danych panelowych z obserwacjami przez 5 lat z rzędu i używam Staty. Moja zmienna bieżąca to liczba dni między datą urodzenia a końcem roku kalendarzowego. Data graniczna to 1 stycznia.

Problem: sumuję obserwacje na przestrzeni lat, ale robiąc to teraz, zmienna bieżąca nie przedstawia żadnej wartości po lewej stronie.

Moje proponowane rozwiązanie tego problemu: Przesuwam okno czasowe zainteresowania z stycznia na grudzień na lipiec i czerwiec. Oznacza to utworzenie nowej zmiennej bieżącej, w której 0 jest przypisane do osób urodzonych 1 lipca, ..., 30 jest przypisane do osób urodzonych 31 lipca ..., a 364 jest przypisane do osób urodzonych 30 czerwca. Teraz wartość graniczna wynosi 183, co nadal odpowiada 1 stycznia. Na koniec centruję również tę nową zmienną zgodnie z zaleceniami literatury na temat RDD, tak że 1 lipca to teraz -183, 1 stycznia to teraz 0, a 31 grudnia to +183. Teraz mam obserwacje zarówno po lewej, jak i po prawej stronie wartości odcięcia zmiennej biegnącej; ta nowa zmienna pozwala mi również uruchamiać RDD z różnymi szerokościami pasma.

Moje pytania:

  1. Co sądzisz o tych nowych zmienionych skalach? Czy to rozwiązanie można uznać za manipulację danymi w złym znaczeniu? (np. czy wymyślam dane i otrzymuję wyniki, które nie odzwierciedlają rzeczywistości?)
  2. Używam ostrego RDD, czy to właściwe?
  3. Jeśli ostre RDD jest odpowiednie, czy powinienem używać również rozmytego RDD jako sprawdzianu niezawodności? (Jako kontrole odporności używam już różnych narzędzi, jak tutaj zaproponowano )

To pytanie jest także obecne w „Cross Validated”.

Fuca26
źródło

Odpowiedzi:

2

(1) Ponieważ projekt RD rozpoznaje efekt dopiero w momencie odcięcia (w twoim przypadku dokładnie o godzinie 12:00 w ostatnim dniu roku), nie sądzę, aby usunięcie ogonów było kwestią manipulacji danymi. Twoje szacunki naprawdę nie powinny być wrażliwe na obserwacje daleko od granicy, ale zależy to nieco od tego, jak szczegółowe są twoje dane i ile masz obserwacji (wiele danych dotyczących narodzin jest kwartalnych, co może utrudnić tę strategię).

(2) Ostra kontra rozmyta konstrukcja odnosi się do przypisania leczenia. Jeśli twoja terapia zainteresowania rodzi się 31 grudnia w porównaniu z urodzeniem 1 stycznia, to jest to ostry projekt, ponieważ zmienna bieżąca deterministycznie przypisuje leczenie. Jeśli zachodzi nieprzestrzeganie zasad leczenia (tj. Urodziłeś się 30 grudnia, ale w jakiś sposób skończyłeś na „leczeniu” tak, jakbyś urodził się w styczniu następnego roku), wtedy użyjesz rozmytego projektu.

(3) Sharp RD jest tylko specjalnym przypadkiem rozmytego RD. Powiedzmy, że jest wynikiem zainteresowania (w tym przypadku wynagrodzeniem), jest zmienną bieżącą (dzień roku), jest zmienną fikcyjną dla przypisania leczenia, gdzie jeśli a jeśli , a to granica (31 grudnia). Następnie efekt leczenia dla rozmytego projektu jest (od Lee i Lemieux 2010 ):YXDD=1X>cD=0Xcc

τfuzzy=limε0E[Y|X=c+ε]limε0E[Y|X=c+ε]limε0E[D|X=c+ε]limε0E[D|X=c+ε]

Ponieważ oznacza z definicji , mianownik zmniejsza się do , pozostawiając nam ostry efekt leczenia.X>cD=11

sallyraincloud
źródło
Dziękuję za odpowiedź! Nie mogę jednak głosować na twoją odpowiedź, ponieważ w tym stosie. Wymiana tematu mój poinst jest na razie za niski :)
Fuca26