Kiedy naprawiony efekt jest naprawiony?

12

Rozważmy liniowe efekty zauważony model typu: , gdzie jest niezauważalna ale czas niezmienny charakterystyczne i błąd, i indeksować odpowiednio indywidualne obserwacje i czas. Typowym podejściem w regresji efektów stałych (FE) byłoby usunięcie poprzez poszczególne manekiny (LSDV) / usunięcie znaczeń lub przez pierwsze różnicowanie.

yjat=Xjatβ+doja+mijat
domijatdoja

Co zawsze się zastanawiałem: kiedy naprawdę jest „naprawione”?doja

To może wydawać się trywialne pytanie, ale pozwól mi podać dwa przykłady z mojego uzasadnienia.

  1. Załóżmy, że mamy dzisiaj przesłuchać osobę i poprosić o jej dochodu, waga, itd. Więc dostać naszą . Przez następne 10 dni chodzimy do tej samej osoby i codziennie przesłuchujemy ją ponownie, więc mamy dla niej dane panelowe. Czy powinniśmy traktować niezauważone cechy jako ustalone na ten okres 10 dni, kiedy z pewnością zmienią się one w innym momencie w przyszłości? Za 10 dni jej osobista zdolność może się nie zmienić, ale zmieni się wraz z wiekiem. Lub zapytany w bardziej ekstremalny sposób: jeśli przeprowadzam wywiad z tą osobą co godzinę przez 10 godzin dziennie, jej nieobserwowane cechy prawdopodobnie zostaną naprawione w tej „próbce”, ale jak przydatne?X

  2. Teraz załóżmy, że zamiast tego przeprowadzamy z kimś wywiad co miesiąc od początku do końca jej życia przez około 85 lat. Co pozostanie naprawione w tym czasie? Miejsce urodzenia, płeć i kolor oczu najprawdopodobniej, ale poza tym prawie nie mogę myśleć o niczym innym. Ale co ważniejsze: co, jeśli istnieje jakaś cecha, która zmienia się w jednym punkcie jej życia, ale zmiana jest nieskończenie mała? Nie jest to już efekt stały, ponieważ zmienił się, gdy w praktyce ta charakterystyka jest quasi-stała.

Z punktu widzenia statystycznego stosunkowo jasne jest, co to jest ustalony efekt, ale z intuicyjnego punktu widzenia trudno mi to zrozumieć. Być może ktoś inny miał już te myśli i wpadł na spór o to, kiedy ustalony efekt jest naprawdę ustalonym efektem. Byłbym bardzo wdzięczny za inne przemyślenia na ten temat.

Andy
źródło
2
+1, dobre pytanie i dobre odpowiedzi. Być może warto o tym pamiętać "all models are wrong, but some are useful"- George Box .
gung - Przywróć Monikę
Prawdopodobnie jestem zdezorientowany, ale nie jest to kontinuum: 1) jeśli jest traktowane tak samo dla wszystkich , masz model w puli, 2) jeśli jest traktowane tak samo dla wszystkich (zmienne obojętne dla grup, które mogą obejmować „rok” lub „dzień”), masz model FE i 3) jeśli jest traktowany jako rozkład, masz model RE. Zobacz: userwww.service.emory.edu/~tclark7/randomeffects.pdf . i c i z j [ i ] c j [ i ]ciicizj[i]cj[i]
Wayne

Odpowiedzi:

9

Jeśli interesuje Cię ten preparat do wnioskowania przyczynowego o wówczas nieznane ilości reprezentowane przez muszą być stabilne tylko przez czas trwania badania / danych dla ustalonych efektów w celu zidentyfikowania odpowiedniej wielkości przyczynowej. c iβdoja

Jeśli się, że ilości reprezentowane przez nie są stabilne nawet w tym okresie, to ustalone efekty nie będą robić tego, co chcesz. Następnie możesz zamiast tego użyć efektów losowych, chociaż jeśli oczekujesz korelacji między losowymi a , chciałbyś uwarunkować na w konfiguracji wielopoziomowej. Obawa o tę korelację jest często jedną z motywacji do sformułowania efektu o ustalonych efektach, ponieważ w wielu (ale nie wszystkich) okolicznościach nie musisz się o to martwić.c i X i c i ˉ X idojadojaXjadojaX¯ja

Krótko mówiąc, twoje obawy dotyczące zmienności ilości reprezentowanych przez są bardzo uzasadnione, ale głównie dlatego, że wpływają one na dane dotyczące okresu, który masz, a nie okresów, które mogłeś mieć lub które ostatecznie możesz mieć, ale nie masz.doja

sprzężonyprior
źródło
+1 Podoba mi się ta odpowiedź. Ale co z niewiarygodnie małą zmianą w czymś, co powinno zostać naprawione w okresie próbnym? Jeśli moja osoba w 10-dniowej próbce uderzy się w głowę w dniu 6, a później będzie mniej inteligentna przez nieskończenie małą ilość reprezentowaną przez umierające komórki mózgowe (tak jak trywialny przykład): czy jej zdolność nadal można traktować jako ustalony efekt, jeśli jest prawie naprawiony?
Andy
1
Pewnie. Może pomyśl o tym w ten sposób: jest to parametr, który jest stały i może reprezentować coś na świecie, który jest „naprawdę” stały, lub może nie np. Reprezentować średnią czegoś, co faktycznie się zmienia. Pytanie brzmi: jaką różnicę wnioskuje, aby uzyskać stały efekt, a nie coś innego. W przypadku wnioskowania przyczynowego pytanie brzmi: czy przyjęcie założonych efektów zmniejsza dezorientację bardziej niż małe zmiany, które nie zostały uchwycone przez parametr, zwiększają dezorientację.
conjugateprior
@Andy: Kiedy zaczniesz mówić o uderzeniu w głowę zmieniającym czyjeś IQ, ponieważ kilka komórek mózgu zostało urazowych, gdzie to się kończy? Nic, co mierzysz w prawdziwym świecie, nie jest tak ustalone, aby nie zmieniało się (nieskończenie krótko), z chwilą, gdy potrafisz zmierzyć go wystarczająco dokładnie. Musisz po prostu użyć rozsądnego osądu i jasno powiedzieć o tym osądzie, podając swoje wyniki. Jak mówi sprzężonyprior, ustalone efekty są również odmienną koncepcją od „niezmiennej” i odnoszą się zarówno do konkretnej rzeczy (parametrów), jak i do konkretnego celu (populacji, grupy itp.).
Wayne
Masz rację, że przykład z komórkami mózgowymi jest dość daleko posunięty. Chciałem po prostu więcej przemyśleć naturę efektów stałych, ponieważ większość podręczników i wykładów milczy na temat tego intuicyjnego aspektu. Oczywiście podają przykłady, ale żaden z nich nie odpowiedziałby na moje pytania. W tym celu bardzo przydało mi się poruszenie tego pytania tutaj, a dotychczasowe odpowiedzi i komentarze były bardzo przydatne.
Andy
2

Rozróżnienie między efektem stałym a efektem losowym zazwyczaj nie ma wpływu na oszacowania (edycja: przynajmniej w prostych nieskorelowanych przypadkach podręcznika), poza kwestią wydajności, ale znaczną implikacją dla testowania.

Na potrzeby testu pytanie, jakie powinieneś sobie zadać, to jaki poziom hałasu powinien pokonać Twój sygnał? Tj. Do jakiej populacji chcesz uogólnić swoje ustalenia? Korzystając z przykładu (1): czy powinna to być zmienność w tym samym dniu, dłuższy okres, czy zmienność w stosunku do różnych osób?

E(ciE(ci)Xi

JohnRos
źródło
X
cXdo
dojami(doja)
@Andy: Nie widzę powodu, aby nie dopuszczać do korelacji między efektami a hałasem w RE, ale jeśli zgadzamy się co do reszty odpowiedzi, raczej po prostu edytuję swoją odpowiedź.
JohnRos
2

Xjatβ

yjat=doja+mijat

Który można postrzegać jako losowy spacer, cofając się w czasie:

yjat=doja+mijatyjat-1=doja+mijat-1yjat-yjat-1=mijat-mijat-1

Xjatβmijat

doja

Mogę zgadnąć dla twojego konkretnego przykładu ankiety, pytania mierzące dane dotyczące rodzaju przepływu (np. Dochód, waga) mogą być uzasadnione, ponieważ losowe spacery w szczególnie krótkich ramach czasowych. Dane dotyczące rodzajów zapasów (takie jak liczba wypitych dziś kaw ) wydają się nieco bardziej przewrotnym założeniem.

Andy W.
źródło
+1 Dzięki za link i twoją odpowiedź! Cieszę się, że to pytanie wciąż wzbudza zainteresowanie i że można do niego dodać więcej. To było wnikliwe.
Andy