W modelu wielopoziomowym, jakie są praktyczne i związane z interpretacją implikacje oszacowania w porównaniu z niedoszacowaniem parametrów korelacji efektu losowego? Praktycznym powodem pytania jest to, że w ramce Lmer w R nie ma zaimplementowanej metody szacowania wartości p za pomocą technik MCMC, gdy dokonuje się szacunków w modelu korelacji między parametrami.
Na przykład, patrząc na ten przykład (części cytowane poniżej), jakie są praktyczne implikacje M2 w porównaniu z M3. Oczywiście w jednym przypadku P5 nie zostanie oszacowane, aw drugim tak się stanie.
pytania
- Ze względów praktycznych (chęć uzyskania wartości p za pomocą technik MCMC) można dopasować model bez korelacji między efektami losowymi, nawet jeśli P5 jest zasadniczo niezerowe. Jeśli to zrobi, a następnie oszacuje wartości p za pomocą techniki MCMC, czy wyniki są interpretowalne? (Wiem, @Ben Bolker wspominał wcześniej, że „łączenie testów istotności z MCMC jest trochę niespójne statystycznie, chociaż rozumiem potrzebę tego (uzyskanie przedziałów ufności jest bardziej możliwe)” , więc jeśli to pozwoli ci lepiej spać w nocy udawaj, że mówiłem o przedziałach ufności).
- Jeśli nie uda się oszacować P5, czy to to samo, co stwierdzenie, że wynosi 0?
- Jeśli P5 naprawdę jest niezerowy, to w jaki sposób wpływa to na oszacowane wartości P1-P4?
- Jeśli P5 naprawdę jest niezerowy, to w jaki sposób wpływa to na oszacowanie błędu dla P1-P4?
- Jeśli P5 naprawdę jest niezerowy, to w jaki sposób błędne są interpretacje modelu, który nie zawiera P5?
Pożyczanie od odpowiedzi @ Mike'a Lawrence'a (osoby bardziej kompetentne niż ja mogę to zastąpić pełną notacją modelu, nie jestem do końca pewien, czy mogę to zrobić z rozsądną wiernością):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(Szacunki P1 - P4)
M3: V1 ~ (1+V3|V2) + V3
(Oszacowania P1-P5)
Parametry, które można oszacować:
P1 : Globalny przechwytywanie
P2 : Przechwytuje efekt losowy dla V2 (tj. Dla każdego poziomu V2, odchylenie przechwytywania tego poziomu od globalnego przechwytywania)
P3 : Pojedyncza globalna ocena wpływu (nachylenia) V3
P4 : Wpływ V3 na każdym poziomie V2 (a dokładniej stopień, w jakim efekt V3 na danym poziomie odbiega od globalnego efektu V3), jednocześnie wymuszając zerową korelację między odchyleniami przechwytującymi a odchyleniami efektu V3 między poziomami V2.
P5 : Korelacja między odchyleniami przechwytującymi a odchyleniami V3 na różnych poziomach V2
Odpowiedzi uzyskane z wystarczająco dużej i szerokiej symulacji wraz z towarzyszącym kodem w języku R za pomocą lmera byłyby dopuszczalne.
źródło
Odpowiedzi:
Rozważ dane dotyczące uśpienia zawarte w lme4. Bates omawia to w swojej książce online o lme4. W rozdziale 3 rozważa dwa modele danych.
i
W badaniu wzięło udział 18 osób, badanych przez okres 10 dni pozbawionych snu. Czasy reakcji obliczono na początku i na kolejne dni. Istnieje wyraźny wpływ między czasem reakcji a czasem trwania deprywacji snu. Istnieją również znaczące różnice między podmiotami. Model A dopuszcza możliwość interakcji między przypadkowym efektem przechwytywania a efektem nachylenia: wyobraźmy sobie, powiedzmy, że osoby o słabym czasie reakcji cierpią bardziej dotkliwie z powodu braku snu. Oznaczałoby to dodatnią korelację efektów losowych.
W przykładzie Batesa nie było widocznej korelacji z wykresu Kraty i nie było znaczącej różnicy między modelami. Jednak, aby zbadać postawione wyżej pytanie, postanowiłem wziąć dopasowane wartości z badania snu, zwiększyć korelację i spojrzeć na wydajność obu modeli.
Jak widać z obrazu, długi czas reakcji wiąże się z większą utratą wydajności. Korelacja zastosowana w symulacji wyniosła 0,58
Symulowałem 1000 próbek, stosując metodę symulacji w lme4, w oparciu o dopasowane wartości moich sztucznych danych. Dopasowałem M0 i Ma do każdego z nich i spojrzałem na wyniki. Oryginalny zestaw danych zawierał 180 obserwacji (10 dla każdego z 18 pacjentów), a symulowane dane mają tę samą strukturę.
Najważniejsze jest to, że różnica jest bardzo mała.
Dlaczego tak się dzieje? @gung domyślił się, że nieuwzględnienie możliwości korelacji zmusza losowe efekty do nieskorelowania. Być może powinno; ale w tej implementacji dozwolone są korelacje efektów losowych, co oznacza, że dane są w stanie wyciągnąć parametry we właściwym kierunku, niezależnie od modelu. Błędność niewłaściwego modelu pojawia się w prawdopodobieństwie, dlatego możesz (czasami) rozróżnić dwa modele na tym poziomie. Model efektów mieszanych zasadniczo dopasowuje regresje liniowe do każdego podmiotu, pod wpływem tego, co według modelu powinno być. Zły model wymusza dopasowanie mniej prawdopodobnych wartości niż w przypadku właściwego modelu. Ale parametry na koniec dnia zależą od dopasowania do rzeczywistych danych.
Oto mój nieco niezręczny kod. Chodziło o dopasowanie danych z badania snu, a następnie zbudowanie symulowanego zestawu danych o tych samych parametrach, ale z większą korelacją dla efektów losowych. Ten zestaw danych został przekazany do simulation.lmer () w celu symulacji 1000 próbek, z których każda pasowała w obie strony. Po sparowaniu dopasowanych obiektów mogłem wyciągnąć różne cechy dopasowania i porównać je za pomocą testów t lub cokolwiek innego.
źródło
Placidia udzieliła już dokładnej odpowiedzi przy użyciu danych symulowanych na podstawie
sleepstudy
zestawu danych. Oto kolejna (mniej rygorystyczna) odpowiedź, która również wykorzystujesleepstudy
dane.Widzimy, że można wpływać na oszacowaną korelację między przypadkowym przechwyceniem a losowym nachyleniem poprzez „przesunięcie” losowej zmiennej predykcyjnej. Spójrz na wyniki z modeli
fm1
ifm2
poniżej:Na podstawie wyników modelu widzimy, że korelacja wariancji losowej uległa zmianie. Jednak nachylenia (stałe i losowe) pozostały takie same, jak oszacowano wariancję resztkową. Wartości przecięcia (stałe i losowe) zmieniły się w odpowiedzi na zmienną przesuniętą.
Dekorelacja losowej kowariancji przechwytywania-nachylenia dla LMM została omówiona w notatkach z wykładów dr Jacka Weissa tutaj . Weiss zauważa, że zmniejszenie korelacji wariancji w ten sposób może czasem pomóc między innymi w konwergencji modeli.
Powyższy przykład zmienia losową korelację (parametr „P5”). Częściowo odnosząc się do Q3 PO, z powyższego wynika, że:
źródło