Macierz wariancji-kowariancji w lmer

18

Wiem, że jedną z zalet modeli mieszanych jest to, że pozwalają one określić macierz wariancji-kowariancji dla danych (symetria złożona, autoregresja, nieustrukturyzowana itp.). Jednak lmerfunkcja w R nie pozwala na łatwą specyfikację tej macierzy. Czy ktoś wie, która struktura lmerużywa domyślnie i dlaczego nie ma sposobu, aby ją łatwo określić?

Nikita Kuzniecow
źródło

Odpowiedzi:

9

Modele mieszane to (uogólnione wersje) modele komponentów wariancyjnych. Zapisujesz część ze stałymi efektami, dodajesz terminy błędów, które mogą być wspólne dla niektórych grup obserwacji, w razie potrzeby dodajesz funkcję linku i umieszczasz ją w maksymalizatorze prawdopodobieństwa.

Różne struktury wariancji, które opisujesz, są jednak działającymi modelami korelacji uogólnionych równań szacunkowych, które podważają pewną elastyczność modeli mieszanych / wielopoziomowych pod względem niezawodności wnioskowania. W przypadku GEE interesuje Cię tylko wnioskowanie na części stałej i nic ci nie jest w szacowaniu składników wariancji, jak w modelu mieszanym. W przypadku tych ustalonych efektów otrzymujesz wiarygodne / prawidłowe oszacowanie, które jest odpowiednie, nawet jeśli twoja struktura korelacji jest błędna. Wnioskowanie dla modelu mieszanego załamie się, jeśli model zostanie błędnie określony.

Tak więc, chociaż mają one wiele wspólnego (wielopoziomowa struktura i zdolność do radzenia sobie z korelacjami szczątkowymi), modele mieszane i GEE są nadal nieco odrębnymi procedurami. Pakiet R, który zajmuje się GEE, jest odpowiednio wywoływany gee, a na liście możliwych wartości corstropcji znajdziesz wspomniane struktury.

Z punktu widzenia GEE lmerdziała z wymiennymi korelacjami ... przynajmniej wtedy, gdy model ma dwa poziomy hierarchii i określono tylko losowe przechwyty.

StasK
źródło
Dziękuję, Stasiu. Nie słyszałem wcześniej o GEE i po prostu próbuję nauczyć się mieszanego modelowania (co jest trudne, a także wzmacniane przez różnice we wdrażaniu oprogramowania). Spróbuję GEE. Naprawdę mam prosty eksperyment z powtarzanymi pomiarami z miernikami zależnymi od biomedycyny. Najbardziej interesuje mnie część stała. Moje poprzednie szkolenie dotyczyło głównie standardowych ANOVA o ustalonych efektach, więc może być łatwiejsze przejście.
Nikita Kuznetsov
Podoba mi się pomysł oszacowania stałych parametrów i wypróbowałem bibliotekę Gee. Są też inne biblioteki (na przykład geepack). Czy są z jakiegoś powodu gorsze? W mojej dziedzinie ludzie muszą zgłaszać wartości p. Czy istnieje sposób na uzyskanie tych danych szacunkowych, a także przeprowadzenie porównań parami z uwzględnieniem grupowania?
Nikita Kuznetsov
Porównania parami czego? Różnorodność bibliotek R zawsze doprowadzała mnie do szału i nie badam różnic między pakietami, chyba że naprawdę potrzebuję pracować nad konkretnym modelem.
StasK
StatsK, czy to naprawdę poprawne? Jestem początkującym w modelowaniu wielopoziomowym, ale Hox (2010) lub Rabe-Hesketh & Skrondal (2013) wyraźnie rozróżniają różne estymatory wariancji za pośrednictwem MLE i GEE. Na przykład podczas obliczania „solidnego” standardowego błędu wielowarstwowego Hox (s. 260) mówi, że można albo obliczyć je za pomocą modelowania wielopoziomowego przy użyciu macierzy informacji / odwrotności macierzy Hesji (biorąc pod uwagę strukturę wielopoziomową) lub poprzez oszacowanie wariancji na podstawie surowe pozostałości, a następnie użycie GLS do obliczenia współczynników (podejście GEE)
Arne Jonas Warnke
1
Nie jestem pewien, czy zaproponowane przez StasK rozróżnienie jest tutaj naprawdę poprawne. Chociaż te alternatywne struktury korelacji są rzeczywiście stosowane przez GEE, możliwe jest dopasowanie (w pełni parametryczne) modeli mieszanych o bardziej skomplikowanych strukturach dla kowariancji efektów losowych lub błędów resztowych oraz pakietu nlme w R, SAS Proc Mixed lub Robią to mieszane polecenia Staty.
Jonathan Bartlett,
4

Oddział lmer FlexLamba zapewnia taką funkcjonalność.

Zobacz przykłady https://github.com/lme4/lme4/issues/224, jak zaimplementować określoną strukturę błędów lub efektów losowych.

majom
źródło
Czy mogę zainstalować jednocześnie oddziały zwykłe i FlexLambda ?. W jaki sposób?
skan
3

Według mojej wiedzy lmer nie ma „łatwego” sposobu na rozwiązanie tego problemu. Biorąc również pod uwagę, że w większości przypadków lmer intensywnie wykorzystuje rzadkie matryce do faktoryzacji Cholesky'ego, uważam, że jest mało prawdopodobne, że pozwala on na całkowicie nieustrukturyzowane VCV.

(1|Rzanremifafa1)+(1|Rzanremifafa2))

R=[σRmi12)000000σRmi12)000000σRmi12)000000σRmi2)2)000000σRmi2)2)000000σRmi2)2)]

Wszystko to nie jest stracone dzięki LME: Możesz łatwo określić te atrybuty macierzy VCV, jeśli używasz pakietu R MCMCglmm. Spójrz na CourseNotes.pdf , s.70 . Na tej stronie podano pewne analogie dotyczące definicji struktury efektów losowych lme4, ale jak się przekonacie, lmer jest mniej elastyczny niż MCMCglmm w tej kwestii.

W połowie drogi jest problem z klasami lSM corStruct, np. corCompSymm , corAR1 itd. itd . Odpowiedź Fabiana w tym bieżniku daje bardziej zwięzłe przykłady specyfikacji VCV opartej na lme4, ale jak wspomniano wcześniej, nie są one tak wyraźne jak te w MCMCglmm lub nlme.

usεr11852 mówi Reinstate Monic
źródło
Nie ufam MCMCglmm ze względu na naiwny wybór wcześniejszych dystrybucji.
Stéphane Laurent,
A. Nie wydaje mi się, żeby to było „naiwne”; mogą odzwierciedlać prawidłowe założenia. Możesz nawet zdefiniować niewłaściwe priory, jeśli czujesz to do czegoś mocno. B. To była tylko część mojej odpowiedzi, nie mówiłem, że to jedyna droga; Dałem przykład dla lme4. C. Jeśli potrzebujesz robić mieszane efekty wielowymiarowe, jest to praktycznie jedyny dostępny pakiet wraz z sabreR ...
mówi usεr11852 Przywróć Monic
Przepraszam, mój komentarz nie był krytyką twojej odpowiedzi. Mówiąc „naiwni priory”, mówiłem o nieinformacyjnych priorsach.
Stéphane Laurent,
Nie wydaje się prawdopodobne, aby ta macierz R była poprawna. Nawet „klasyczna” ANOVA z powtarzanymi pomiarami pozwala na niezerowe korelacje między warunkami (mam na myśli złożoną macierz symetrii). Wydaje mi się, że ta macierz byłaby ważna tylko dla projektu między podmiotami z losowym przypisaniem z dwoma klastrami.
Nikita Kuznetsov
(1|Rzanremifafa1)+(1|Rzanremifafa2))