W modelu efektów mieszanych zaleca się stosowanie stałego efektu do oszacowania parametru, jeśli uwzględniono wszystkie możliwe poziomy (np. Zarówno mężczyzn, jak i kobiety). Ponadto zaleca się stosowanie efektu losowego w celu uwzględnienia zmiennej, jeśli uwzględnione poziomy są tylko losową próbką z populacji (pacjenci włączeni z wszechświata możliwych pacjentów), a zamiast średnich chcesz oszacować średnią populacji i wariancję poszczególnych poziomów czynników.
Zastanawiam się, czy jesteś logicznie zobowiązany do tego, aby zawsze używać stałego efektu w ten sposób. Zastanów się nad badaniem zmian rozmiaru stopy / buta w miarę rozwoju i związanych z, powiedzmy, wzrostem, wagą i wiekiem. wyraźnie musi zostać w jakiś sposób uwzględniony w modelu, aby uwzględnić fakt, że pomiary na przestrzeni lat są zagnieżdżone w obrębie danej stopy i nie są niezależne. Co więcej, prawa i lewa to wszystkie możliwości, które mogą istnieć. Ponadto może być prawdą, że dla danego uczestnika jego prawa stopa jest większa (lub mniejsza) niż lewa. Jednak pomimo tego, że rozmiar stopy różni się nieco między stopami u wszystkich ludzi, nie ma powodu, aby sądzić, że prawa stopa będzie średnio większa niż stopa lewa. Jeśli znajdują się w twojej próbce, prawdopodobnie wynika to z genetyki ludzi w próbie, a nie z czegoś właściwego dla prawej stopy. Wreszcie, wydaje się uciążliwości parametru, a nie coś naprawdę zależy.
Pragnę zauważyć, że wymyśliłem ten przykład. To może nie być dobre; chodzi tylko o to, aby ten pomysł został zrealizowany. Z tego, co wiem, posiadanie dużej prawej stopy i małej lewej stopy było konieczne do przetrwania w paleolicie.
Czy w takim przypadku sensowne byłoby (w większym / mniejszym stopniu) włączenie do modelu jako efektu losowego? Jakie byłyby zalety i wady korzystania ze stałego i losowego efektu tutaj?
źródło
Odpowiedzi:
Ogólny problem z efektami „ustalonymi” i „losowymi” polega na tym, że nie są one zdefiniowane w spójny sposób. Andrew Gelman cytuje kilka z nich:
i zauważa, że są nie spójne. W swojej książce Analiza danych przy użyciu regresji i modeli wielopoziomowych / hierarchicznych ogólnie unika używania tych terminów, aw swojej pracy skupia się na ustalonych lub zmieniających się przechwytywaniach i nachyleniach między grupami, ponieważ
Jest to szczególnie prawdziwe w przypadku szkieletu Bayesa - powszechnie stosowanego w modelach mieszanych - gdzie wszystkie efekty są losowe same w sobie. Jeśli myślisz o Bayesianie, tak naprawdę nie przejmujesz się „ustalonymi” efektami i oszacowaniami punktów i nie masz problemu z traktowaniem wszystkich efektów jako losowych.
Im więcej czytam na ten temat, tym bardziej jestem przekonany, że jest to raczej ideologiczna dyskusja na temat tego, co możemy (lub powinniśmy) oszacować i co możemy tylko przewidzieć (tutaj mogę odnieść się również do twojej własnej odpowiedzi ). Korzystasz z efektów losowych, jeśli masz losową próbkę możliwych wyników, więc nie martwisz się indywidualnymi szacunkami i zależy ci raczej na efektach populacji, a następnie jednostkach. Zatem odpowiedź na twoje pytanie zależy również od tego, co myślisz, jeśli chcesz lub możesz oszacować ustalone efekty na podstawie twoich danych. Jeśli wszystkie możliwe poziomy są zawarte w twoich danych, możeszoszacuj ustalone efekty - również, podobnie jak w twoim przykładzie, liczba poziomów może być niewielka, co ogólnie nie byłoby dobre do oszacowania efektów losowych i istnieją pewne minimalne wymagania w tym zakresie .
Argument najlepszego scenariusza
Powiedz, że masz nieograniczoną ilość danych i nieograniczoną moc obliczeniową. W takim przypadku można sobie wyobrazić oszacowanie każdego efektu jako ustalonego, ponieważ ustalone efekty dają większą elastyczność (pozwalają nam porównać poszczególne efekty). Jednak nawet w tym przypadku większość z nas niechętnie stosuje stałe efekty do wszystkiego.
Na przykład wyobraź sobie, że chcesz modelować wyniki egzaminów ze szkół w danym regionie i masz dane dotyczące wszystkich 100 szkół w regionie. W takim przypadku możesz zagrozić szkołom jako ustalonym - ponieważ masz dane na wszystkich poziomach - ale w praktyce prawdopodobnie wolisz myśleć o nich jako przypadkowych. Dlaczego?
Jednym z powodów jest to, że generalnie w tego rodzaju przypadkach nie interesują cię efekty poszczególnych szkół (i trudno jest porównać wszystkie), a raczej ogólna zmienność między szkołami.
Kolejnym argumentem tutaj jest modelowe parsimony. Zasadniczo nie jesteś zainteresowany modelem „każdego możliwego wpływu”, więc do swojego modelu dołączasz kilka ustalonych efektów, które chcesz przetestować i kontrolować dla innych możliwych źródeł zmienności. To sprawia, że modele efektów mieszanych pasują do ogólnego sposobu myślenia o modelowaniu statystycznym, w którym szacujesz coś i kontrolujesz inne rzeczy. W przypadku skomplikowanych (wielopoziomowych lub hierarchicznych) danych masz wiele efektów do uwzględnienia, więc grozisz niektórym jako „ustalone”, a niektóre jako „losowe”, aby je kontrolować.
W tym scenariuszu nie pomyślałbyś również o szkołach, które mają swój własny, niepowtarzalny wpływ na wyniki, a raczej o szkołach, które mają pewien wpływ w ogóle. Tak więc ten argument byłby taki, że uważamy , że tak naprawdę nie jest możliwe oszacowanie unikalnych efektów poszczególnych szkół, dlatego grożymy im jako losową próbką możliwych efektów szkół.
Modele z efektami mieszanymi znajdują się gdzieś pomiędzy scenariuszami „wszystko naprawione” i „wszystko losowe”. Dane, które napotykamy, pozwalają nam obniżyć nasze oczekiwania co do oszacowania wszystkiego jako efekty ustalone, więc decydujemy, jakie efekty chcemy porównać i jakie efekty chcemy kontrolować, lub ogólnie odczuwamy ich wpływ. Nie chodzi tylko o to, jakie są dane, ale także o to, jak myślimy o danych podczas ich modelowania.
źródło
Streszczenie wykonawcze
Rzeczywiście często mówi się, że jeśli wszystkie możliwe poziomy czynników są uwzględnione w modelu mieszanym, to czynnik ten należy traktować jako efekt stały. To niekoniecznie jest DOTYCZĄCE DWÓCH ROZRÓŻNYCH POWODÓW:
(1) Jeśli liczba poziomów jest duża, sensowne może być potraktowanie czynnika [skrzyżowanego] jako losowego.
Zgadzam się z @Tim i @RobertLong tutaj: jeśli czynnik ma dużą liczbę poziomów, które wszystkie są uwzględnione w modelu (np. Wszystkie kraje na świecie; lub wszystkie szkoły w kraju; a może cała populacja badani są badani itp.), wtedy nie ma nic złego w traktowaniu go jako losowego --- może to być bardziej oszczędne, może powodować pewien skurcz itp.
(2) Jeśli czynnik jest zagnieżdżony w innym losowym efekcie, należy go traktować jako losowy, niezależnie od liczby poziomów.
W tym wątku było ogromne zamieszanie (patrz komentarze), ponieważ inne odpowiedzi dotyczą przypadku nr 1 powyżej, ale podany przez ciebie przykład jest przykładem innej sytuacji, mianowicie tego przypadku nr 2. Tutaj są tylko dwa poziomy (tj. Wcale nie „duża liczba”!) I wyczerpują wszystkie możliwości, ale są zagnieżdżone w innym losowym efekcie , dając zagnieżdżony efekt losowy.
Szczegółowa dyskusja twojego przykładu
Strony i przedmioty w twoim wyimaginowanym eksperymencie są powiązane jak klasy i szkoły w standardowym przykładzie modelu hierarchicznego. Być może każda szkoła (# 1, # 2, # 3 itd.) Ma klasę A i klasę B, a te dwie klasy powinny być mniej więcej takie same. Nie będziesz modelować klas A i B jako stałego efektu z dwoma poziomami; to byłby błąd. Nie będziesz jednak modelować klas A i B jako „osobnego” (tj. Skrzyżowanego) efektu losowego z dwoma poziomami; to też byłby błąd. Zamiast tego zamodelujesz klasy jako zagnieżdżony efekt losowy w szkołach.
Zobacz tutaj: Skrzyżowane vs zagnieżdżone efekty losowe: czym się różnią i jak są poprawnie określone w lme4?
Jak sam napisałeś, „nie ma powodu, aby sądzić, że prawa stopa będzie średnio większa niż lewa”. Zatem nie powinno być żadnego „globalnego” efektu (ani stałego, ani losowego skrzyżowania) prawej lub lewej stopy; zamiast tego można pomyśleć o tym, że każdy ma stopę „jedną” i „drugą”, a tę zmienność powinniśmy uwzględnić w modelu. Te „jedna” i „druga” stopa są zagnieżdżone w podmiotach, stąd zagnieżdżone efekty losowe.
Więcej szczegółów w odpowiedzi na komentarze. [26 września]
Mój model powyżej zawiera Side jako zagnieżdżony efekt losowy w Tematach. Oto alternatywny model, sugerowany przez @Robert, w którym Side jest stałym efektem:
Nie może
To samo dotyczy hipotetycznego modelu @ gung z Side jako efektem losowym skrzyżowania:
Nie uwzględnia również zależności.
Demonstracja za pomocą symulacji [2 października]
Oto bezpośrednia demonstracja w języku R.
Generuję zestaw danych zabawek z pięcioma badanymi mierzonymi na obu stopach przez pięć kolejnych lat. Wpływ wieku jest liniowy. Każdy obiekt ma losowy punkt przechwytywania. I każdy obiekt ma jedną stopę (lewą lub prawą) większą od drugiej.
Przepraszamy za moje okropne umiejętności R. Oto jak wyglądają dane (każda kolejna pięć kropek to jedna stopa jednej osoby mierzona na przestrzeni lat; każda kolejna dziesięć kropek to dwie stopy tej samej osoby):
Teraz możemy zmieścić kilka modeli:
Wszystkie modele mają ustalony efekt
age
losowy i efekt losowysubject
, ale traktująside
inaczej.side
age
side
age
side
age
To wyraźnie pokazuje, że
side
należy je traktować jako zagnieżdżony efekt losowy.Wreszcie w komentarzach @Robert zasugerował uwzględnienie globalnego efektu
side
jako zmiennej kontrolnej. Możemy to zrobić, zachowując zagnieżdżony efekt losowy:Te dwa modele niewiele różnią się od # 3. Model 4 daje niewielki i nieznaczny stały efektt=0.5
side
(side
źródło
side
spełniała jakąkolwiek zwykłą definicję / wytyczne, kiedy czynnik powinien być traktowany jako losowy vs. ustalony. W szczególności wyciąganie wniosków poza próbkowane poziomy współczynnika jest bez znaczenia. Co więcej, mając tylko 2 poziomy tego współczynnika, traktowanie go jako ustalonego wydaje się niejednoznacznym i prostym sposobem podejścia do modelowania.side
jako efekt stały oznacza zakładanie, że jedna strona (np. Prawa) jest zawsze większa od drugiej (lewa), o określoną wartość. Ta kwota jest taka sama dla wszystkich ludzi. To nie jest wyraźnie to, co miał na myśli PO. Napisał, że u niektórych osób prawo może być większe, au niektórych - lewica. Musimy jednak uwzględnić toside
ze względu na skorelowane błędy. Dlaczego więc nie możemy traktować tego jako zagnieżdżonego efektu losowego? To dokładnie tak, jak zajęcia w szkołach.Aby dodać do innych odpowiedzi:
Nie sądzę, abyś był logicznie zobowiązany do stosowania stałego efektu w sposób opisany w PO. Nawet jeśli nie są spełnione zwykłe definicje / wytyczne, kiedy należy traktować czynnik jako losowy, mogę być skłonny nadal modelować go jako losowy, gdy istnieje duża liczba poziomów, tak więc traktowanie współczynnika jako ustalonego zużyłoby wiele stopni wolność i wynikający z tego uciążliwy i mniej oszczędny model.
źródło
side
efektu losowego jako ustalonego lub skrzyżowanego koniecznie oznacza założenie, że jedna ze stron (np. Prawa) jest zawsze większa niż druga (Lewa), dla wszystkich badanych. Nie jest to wyraźnie to, co napisał Gung w swoim OP, stwierdzając, że „nie ma powodu, aby sądzić, że prawa stopa będzie średnio większa niż lewa”. Nadal widzę przykład Gunga jako wyraźny przypadek zagnieżdżonego efektu losowego, w pełnej analogii z klasami w szkołach.Jeśli mówisz o sytuacji, w której znasz wszystkie możliwe poziomy interesującego Cię czynnika, a także posiadasz dane do oszacowania efektów, to zdecydowanie nie musisz przedstawiać poziomów z efektami losowymi.
Powodem, dla którego chcesz ustawić czynnik losowy na czynnik, jest fakt, że chcesz wnioskować na temat efektów wszystkich poziomów tego czynnika, które zwykle są nieznane. Aby dokonać tego rodzaju wnioskowania, zakłada się założenie, że skutki wszystkich poziomów tworzą ogólnie rozkład normalny. Ale biorąc pod uwagę ustawienie problemu, możesz oszacować skutki wszystkich poziomów. Zatem z pewnością nie ma potrzeby ustawiania efektów losowych i narzucania dodatkowych założeń.
To tak, jakbyś był w stanie uzyskać wszystkie wartości populacji (więc znasz prawdziwą średnią), ale próbujesz pobrać dużą próbkę z populacji i użyć centralnego twierdzenia o granicy, aby oszacować rozkład próbkowania, a następnie wnioskować na temat prawdziwego środka.
źródło