W badaniu podłużnym wyniki jednostek są wielokrotnie mierzone w punktach czasowych z łącznie ustalone okazje pomiarowe (ustalone = pomiary jednostek są wykonywane w tym samym czasie).
Jednostki są losowo przypisywane do leczenia, lub do grupy kontrolnej, . Chcę oszacować i przetestować średni efekt leczenia, tj
z przechwycenie, , losowe przechwytywanie między jednostkami, oraz resztkowe.
Teraz rozważam alternatywny model
który zawiera ustalone efekty na każdą okazję gdzie manekin gdyby i jeszcze. Ponadto model ten zawiera interakcję między leczeniem a czasem z parametrami. Tak więc ten model bierze pod uwagę efektmogą się różnić w czasie. Jest to samo w sobie pouczające, ale uważam, że powinno to również zwiększyć precyzję szacowania parametrów, ponieważ niejednorodność w jest brany pod uwagę.
Jednak w tym modelu współczynnik wydaje się nie być równy już. Zamiast tego reprezentuje ATE przy pierwszej okazji (). Więc oszacowanie może być bardziej wydajny niż ale to nie reprezentuje już.
Moje pytania to :
- Jaki jest najlepszy sposób oszacowania efektu leczenia w tym projekcie badania podłużnego?
- Czy muszę korzystać z modelu 1, czy jest sposób na wykorzystanie (być może bardziej wydajnego) modelu 2?
- Czy jest na to sposób mieć interpretację i odchylenie specyficzne dla okazji (np. przy użyciu kodowania efektów)?
Odpowiedzi:
Odpowiadając na twoje pytanie „Zastanawiam się, jak wyciągnąć ATE z modelu 2” w komentarzach:
Po pierwsze, w twoim modelu 2 nie wszystkieγjot jest identyfikowalny, co prowadzi do problemu niedoboru rang w matrycy projektowej. Konieczne jest opuszczenie jednego poziomu, na przykład zakładanieγjot= 0 dla j = 1 . Oznacza to, że stosując kodowanie kontrastu i zakładając, że efekt leczenia w okresie 1 wynosi 0. W R koduje termin interakcji z efektem leczenia w okresie 1 jako poziom odniesienia, i to jest również powód, dla któregoβ~ ma interpretację efektu leczenia w okresie 1. W SAS koduje efekt leczenia w okresie m jako poziom odniesienia β~ ma interpretację efektu leczenia w danym okresie m , nie kropka już 1.
Zakładając, że kontrast jest tworzony w sposób R, wówczas współczynniki szacowane dla każdego składnika interakcji (nadal będę to oznaczać przezγjot , chociaż nie jest to dokładnie to, co zdefiniowałeś w swoim modelu) ma interpretację różnicy efektu leczenia między okresem jot i okres 1. Oznacz ATE w każdym okresie A T Ejot , następnie γjot=A T Ejot-A T E1 dla j = 2 , … , m . Dlatego estymator dlaA T Ejot jest β~+γjot . (ignorując różnicę notacji między prawdziwym parametrem a samym estymatorem, ponieważ lenistwo) I oczywiście twojeA T E =β=1m∑mj = 1A T Ejot=β~+ (β~+γ2)) + ⋯ + (β~+γm)m=β~+1m(γ2)+ ⋯ +γm) .
Wykonałem prostą symulację w R, aby to sprawdzić:
Wyniki potwierdzają to:
Nie wiem, jak bezpośrednio zmienić kodowanie kontrastu w powyższym modelu 2, więc aby zilustrować, w jaki sposób można bezpośrednio użyć funkcji liniowej terminów interakcji, a także jak uzyskać błąd standardowy, użyłem pakietu multcomp:
A oto wynik:
Myślę, że standardowy błąd jest uzyskiwany przezwV.^wT.-----√ z w będący powyższą formą kombinacji liniowej i V. oszacowana macierz wariancji-kowariancji współczynników z modelu 3.
Kodowanie odchyleń
Kolejny sposób na zrobienieβ~ mający bezpośrednią interpretację A T E polega na użyciu kodowania odchylenia , aby później reprezentowały zmienne towarzysząceA T Ejot- A T E porównanie:
Wynik:
źródło
beta_t
) jest ATE bezpośrednio (wtedy z oszacowaniem SE)?W przypadku pierwszego pytania rozumiem, że „fantazyjne” sposoby są potrzebne tylko wtedy, gdy nie jest od razu oczywiste, że leczenie jest niezależne od potencjalnych rezultatów. W takich przypadkach należy argumentować, że niektóre aspekty danych pozwalają na przybliżenie losowego przypisania do leczenia, co prowadzi nas do zmiennych instrumentalnych, nieciągłości regresji i tak dalej.
W twoim przypadku jednostki są losowo przydzielane do leczenia, więc wydaje się prawdopodobne, że leczenie jest niezależne od potencjalnych wyników. Następnie możemy po prostu wszystko uprościć: oszacuj model 1 ze zwykłymi najmniejszymi kwadratami, a będziesz miał spójne oszacowanie ATE. Ponieważ jednostki są losowo przydzielane do leczenia, jest to jeden z niewielu przypadków, w których wiarygodne jest założenie o efektach losowych.
źródło