Mówiąc prościej, jak wyjaśniłbyś (być może za pomocą prostych przykładów) różnicę między modelami efektu stałego, efektu losowego i efektu mieszanego?
266
Mówiąc prościej, jak wyjaśniłbyś (być może za pomocą prostych przykładów) różnicę między modelami efektu stałego, efektu losowego i efektu mieszanego?
Odpowiedzi:
Statystyk Andrew Gelman mówi, że terminy „efekt stały” i „efekt losowy” mają różne znaczenia w zależności od tego, kto ich używa. Być może możesz wybrać, która z 5 definicji dotyczy twojego przypadku. Zasadniczo lepiej może być poszukiwanie równań opisujących model prawdopodobieństwa, z którego korzystają autorzy (podczas czytania), lub zapisanie pełnego modelu prawdopodobieństwa, którego chcesz użyć (podczas pisania).
źródło
(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
Są na to dobre książki, takie jak Gelman i Hill . Poniżej znajduje się podsumowanie ich perspektywy.
Po pierwsze, nie powinieneś zbytnio zajmować się terminologią. W statystykach żargonu nie należy nigdy zastępować matematycznego zrozumienia samych modeli. Dotyczy to szczególnie modeli efektów losowych i mieszanych. „Mieszane” oznacza po prostu, że model ma zarówno stałe, jak i losowe efekty, więc skupmy się na różnicy między stałym i losowym.
Efekty losowe kontra ustalone
Załóżmy, że masz model z predyktorem jakościowym, który dzieli twoje obserwacje na grupy zgodnie z wartościami kategorii. * Współczynniki modelu lub „efekty” związane z tym predyktorem mogą być stałe lub losowe. Najważniejsza praktyczna różnica między nimi jest następująca:
Efekty losowe są szacowane z częściowym łączeniem, podczas gdy efekty stałe nie są.
Częściowe łączenie oznacza, że jeśli masz kilka punktów danych w grupie, oszacowanie efektu grupy będzie częściowo oparte na bardziej obfitych danych z innych grup. Może to być dobry kompromis między oszacowaniem efektu przez całkowite połączenie wszystkich grup, co maskuje zmienność na poziomie grupy, a oszacowaniem efektu dla wszystkich grup całkowicie osobno, co może dać złe oszacowania dla grup o niskiej próbie.
Efekty losowe są po prostu rozszerzeniem techniki częściowej puli jako ogólnego modelu statystycznego. Umożliwia to zasadnicze zastosowanie pomysłu w wielu różnych sytuacjach, w tym w wielu predyktorach, mieszanych zmiennych ciągłych i kategorycznych oraz złożonych strukturach korelacji. (Ale z wielką mocą wiąże się wielka odpowiedzialność: złożoność modelowania i wnioskowania jest znacznie zwiększona i może powodować subtelne uprzedzenia, których należy unikać, aby uniknąć wyrafinowania).
Aby zmotywować model efektów losowych, zadaj sobie pytanie: dlaczego miałbyś częściową pulę? Prawdopodobnie dlatego, że uważasz, że małe podgrupy są częścią większej grupy o wspólnym średnim skutku. Średnie podgrupy mogą nieco różnić się od średniej z dużej grupy, ale nie o dowolną kwotę. Aby sformalizować tę ideę, zakładamy, że odchylenia są zgodne z rozkładem, zazwyczaj Gaussa. Właśnie tutaj pojawia się „losowy” efekt losowy: zakładamy, że odchylenia podgrup od rodzica zależą od rozkładu zmiennej losowej. Gdy przyjrzysz się już temu pomysłowi, równania modelu mieszanych efektów są zgodne z naturą.
Niestety użytkownicy modeli z efektami mieszanymi często mają błędne założenia co do tego, czym są efekty losowe i czym różnią się od efektów stałych. Ludzie słyszą „losowy” i myślą, że oznacza to coś wyjątkowego w modelowanym systemie, jak na przykład stałe efekty muszą być użyte, gdy coś jest „naprawione”, podczas gdy losowe efekty muszą być użyte, gdy coś jest „losowo próbkowane”. Ale nie ma nic szczególnie losowego w założeniu, że współczynniki modelu pochodzą z rozkładu; jest to tylko ograniczenie miękkie, podobne do kary stosowanej do współczynników modelu w regresji grzbietu. Istnieje wiele sytuacji, w których możesz chcieć lub nie używać efektów losowych i niekoniecznie mają one wiele wspólnego z rozróżnieniem między „ustalonymi” a „ℓ2)
Niestety zamieszanie pojęciowe spowodowane tymi terminami doprowadziło do mnóstwa sprzecznych definicji . Z pięciu definicji pod tym linkiem tylko nr 4 jest całkowicie poprawna w ogólnym przypadku, ale jest również całkowicie nieinformacyjna. Musisz przeczytać całe artykuły i książki (lub w przeciwnym razie ten post), aby zrozumieć, co ta definicja oznacza w praktyce.
Przykład
Spójrzmy na przypadek, w którym przydatne może być modelowanie efektów losowych. Załóżmy, że chcesz oszacować średni dochód gospodarstwa domowego w USA według kodu pocztowego. Masz duży zestaw danych zawierający obserwacje dochodów gospodarstw domowych i kody pocztowe. Niektóre kody pocztowe są dobrze reprezentowane w zbiorze danych, ale inne mają tylko kilka gospodarstw domowych.
W przypadku pierwszego modelu najprawdopodobniej weźmiesz średni dochód w każdym ZIP. Będzie to działać dobrze, gdy masz dużo danych dla ZIP, ale szacunki dla źle próbkowanych ZIP-ów będą cierpieć z powodu dużej wariancji. Możesz to złagodzić za pomocą estymatora skurczu (zwanego także częściowym łączeniem pul), który popycha skrajne wartości w kierunku średniego dochodu we wszystkich kodach pocztowych.
Ale ile skurczu / łączenia należy zrobić dla konkretnego pliku ZIP? Intuicyjnie powinno to zależeć od:
Jeśli modelujesz kod pocztowy jako efekt losowy, oszacowanie średniego dochodu we wszystkich kodach pocztowych zostanie poddane statystycznie uzasadnionemu skurczowi, biorąc pod uwagę wszystkie powyższe czynniki.
Najlepsze jest to, że modele efektów losowych i mieszanych automatycznie obsługują (4), oszacowanie zmienności, dla wszystkich efektów losowych w modelu. Jest to trudniejsze, niż się wydaje na pierwszy rzut oka: możesz wypróbować wariancję średniej próbki dla każdego ZIP, ale będzie to tendencyjnie wysokie, ponieważ część wariancji między szacunkami dla różnych ZIP jest tylko wariancją próbkowania. W modelu efektów losowych proces wnioskowania uwzględnia próbkowanie wariancji i odpowiednio zmniejsza oszacowanie wariancji.
Uwzględniając (1) - (4), model efektów losowych / mieszanych jest w stanie określić odpowiedni skurcz dla grup o niskiej próbce. Może także obsługiwać znacznie bardziej skomplikowane modele z wieloma różnymi predyktorami.
Związek z hierarchicznym modelowaniem bayesowskim
Jeśli brzmi to dla ciebie jak hierarchiczne modelowanie bayesowskie, masz rację - jest to bliski krewny, ale nie identyczny. Modele efektów mieszanych są hierarchiczne, ponieważ ustalają rozkłady ukrytych, nieobserwowanych parametrów, ale zazwyczaj nie są one w pełni bayesowskie, ponieważ hiperparametry najwyższego poziomu nie będą miały odpowiednich priorytetów. Na przykład w powyższym przykładzie najprawdopodobniej potraktowalibyśmy średni dochód w danym ZIP jako próbkę z rozkładu normalnego, z nieznaną średnią i sigmą do oszacowania w procesie dopasowania efektów mieszanych. Jednak (nie Bayesowski) model efektów mieszanych zwykle nie będzie miał wcześniejszego wyniku na nieznanej średniej i sigmie, więc nie jest w pełni Bayesowski. To powiedziawszy, z przyzwoitym zestawem danych, standardowy model efektów mieszanych i wariant w pełni bayesowski często dają bardzo podobne wyniki.
* Podczas gdy wiele sposobów traktowania tego tematu koncentruje się na wąskiej definicji „grupy”, koncepcja jest w rzeczywistości bardzo elastyczna: jest to tylko zbiór obserwacji, które mają wspólną właściwość. Grupa może składać się z wielu obserwacji jednej osoby lub wielu osób w szkole, lub wielu szkół w okręgu, lub wielu odmian jednego rodzaju owoców lub wielu rodzajów warzyw z tego samego zbioru lub wielu zbiorów tego samego rodzaju warzywa itp. Każda zmienna kategoryczna może być używana jako zmienna grupująca.
źródło
Pisałem o tym w książkowym rozdziale na temat modeli mieszanych (rozdział 13 w Fox, Negrete-Yankelevich i Sosa 2014 ); odpowiednie strony (s. 311–315) są dostępne w Książkach Google . Myślę, że pytanie sprowadza się do „jakie są definicje efektów stałych i losowych?” („model mieszany” to tylko model zawierający oba te elementy). Moja dyskusja mówi nieco mniej o ich formalnej definicji (dla której odłożyłbym się do artykułu Gelmana połączonego powyższą odpowiedzią @ JohnSalvatier), a więcej o ich praktycznych właściwościach i użyteczności. Oto kilka fragmentów:
źródło
Naprawiono efekt: Coś, co eksperymentator bezpośrednio manipuluje i jest często powtarzalne, np. Podawanie leku - jedna grupa otrzymuje lek, druga grupa otrzymuje placebo.
Efekt losowy: źródło losowej zmienności / jednostek eksperymentalnych, np. Osobników losowo wybranych z populacji do badania klinicznego. Losowe efekty szacują zmienność
Efekt mieszany: Obejmuje oba, ustalony efekt w tych przypadkach szacuje współczynniki poziomu populacji, podczas gdy efekty losowe mogą uwzględniać indywidualne różnice w reakcji na efekt, np. Każda osoba otrzymuje zarówno lek, jak i placebo przy różnych okazjach, ustalony efekt szacuje działanie leku, warunki losowych efektów pozwolą każdej osobie reagować na lek inaczej.
Ogólne kategorie efektów mieszanych - powtarzane miary, wzdłużne, hierarchiczne, podzielone.
źródło
Doszedłem stąd do tego pytania , możliwego duplikatu.
Istnieje już kilka doskonałych odpowiedzi, ale jak stwierdzono w zaakceptowanej odpowiedzi, istnieje wiele różnych (ale powiązanych) zastosowań tego terminu, więc warto podać perspektywę stosowaną w ekonometrii, która nie wydaje się jeszcze w pełni uwzględniona w tym przypadku .
Rozważ liniowy model danych panelowych: tak zwany model komponentu błędu. Tutaj α i
Ta tendencja jednak zanika jakoT.
m
Oto kod, który generuje dane i który generuje dodatnią ocenę RE i „poprawną”, negatywną ocenę FE. (To powiedziawszy, szacunki RE będą również często ujemne dla innych nasion, patrz wyżej).
Wyjście:
źródło
Rozróżnienie to ma znaczenie jedynie w kontekście statystyki nie bayesowskiej. W statystyce bayesowskiej wszystkie parametry modelu są „losowe”.
źródło
W ekonometrii terminy są zwykle stosowane w uogólnionych modelach liniowych, w których model ma formę
W modelach liniowych obecność efektu losowego nie powoduje niespójności estymatora OLS. Jednak użycie losowego estymatora efektów (np. Wykonalnego uogólnionego najmniejszego kwadratu) da więcej wydajny estymator.
W modelach nieliniowych , takich jak probit, tobit, ... obecność efektu losowego na ogół spowoduje niespójny estymator. Użycie losowego estymatora efektów przywróci spójność.
Zarówno w przypadku modeli liniowych, jak i nieliniowych ustalone efekty powodują błąd. Jednak w modelach liniowych można zastosować transformacje (takie jak pierwsze różnice lub poniżanie), w których OLS na przekształconych danych da spójne oszacowania. W przypadku modeli nieliniowych istnieje kilka wyjątków, w których istnieją transformacje, a logit efektów stałych jest jednym z przykładów.
Przykład: probit efektów losowych. Przypuszczać
a zaobserwowany wynik to
Zbiorcza maksymalny estymator prawdopodobieństwa minimalizuje średnia próbka
Oczywiście tutaj log i produkt upraszczają, ale z powodów pedagogicznych sprawia to, że równanie jest bardziej porównywalne z estymatorem efektów losowych, który ma postać
źródło
Nie jest to formalna definicja, ale podobają mi się następujące slajdy: Modele mieszane i dlaczego socjolingwiści powinni ich używać ( lustro ), autorstwa Daniela Ezry Johnsona. Krótkie podsumowanie ”znajduje się na slajdzie 4. Chociaż koncentruje się głównie na badaniach psycholingwistycznych, jest bardzo przydatne jako pierwszy krok.
źródło
Inna bardzo praktyczna perspektywa modeli efektów losowych i stałych pochodzi z ekonometrii podczas regresji liniowej danych panelu . Jeśli szacujesz związek między zmienną objaśniającą a zmienną wynikową w zbiorze danych z wieloma próbkami na osobę / grupę, jest to struktura, której chcesz użyć.
Dobrym przykładem danych panelowych są roczne pomiary z zestawu osób:
Jeśli próbujemy zrozumieć związek między ćwiczeniami a zmianą masy ciała, skonfigurujemy następującą regresję:
W takiej konfiguracji istnieje ryzyko endogeniczności. Może się to zdarzyć, gdy niezmierzone zmienne (takie jak stan cywilny) są związane zarówno z ćwiczeniami, jak i zmianą masy ciała. Jak wyjaśniono na str. 16 w tym wykładzie z Princeton , model efektów losowych (efekty mieszane AKA) jest bardziej wydajny niż model efektów stałych. Jednak niepoprawnie przypisze część wpływu niezmierzonej zmiennej na zmianę masy ciała podczas ćwiczeń, powodując niepoprawnośćβ0 i potencjalnie wyższe znaczenie statystyczne niż jest ważne. W tym przypadku model efektów losowych nie jest spójnym estymatoremβ0 .
Model ze stałymi efektami (w najbardziej podstawowej formie) kontroluje wszelkie nie mierzone zmienne, które są stałe w czasie, ale różnią się między poszczególnymi osobami, wyraźnie włączając osobny termin przechwytywania dla każdej osoby (αja ) w równaniu regresji. W naszym przykładzie automatycznie kontroluje zakłócające skutki związane z płcią, a także wszelkie niezmierzone czynniki zakłócające (stan cywilny, status społeczno-ekonomiczny, poziom wykształcenia itp.). W rzeczywistości płeć nie może być uwzględniona w regresji iβ1 ponieważ nie można oszacować za pomocą modelu efektów stałych sole n de rja jest współliniowy z αja „s.
Kluczowym pytaniem jest więc określenie, który model jest odpowiedni. Odpowiedzią jest test Hausmana . Aby go użyć, wykonujemy regresję efektów stałych i losowych, a następnie stosujemy test Hausmana, aby sprawdzić, czy szacunki ich współczynników znacznie się różnią. Jeśli się rozchodzą, gra się endogeniczność, a najlepszym wyborem jest model z ustalonymi efektami. W przeciwnym razie pójdziemy z losowymi efektami.
źródło