Porównanie lmer i lmer

30

Zastanawiałem się, czy ktokolwiek mógłby mnie oświecić na temat obecnych różnic między tymi dwiema funkcjami. Znalazłem następujące pytanie: Jak wybrać bibliotekę nlme lub lme4 R dla modeli efektów mieszanych? , ale pochodzi to sprzed kilku lat. To całe życie w kręgach oprogramowania.

Moje konkretne pytania to:

  • Czy są (nadal) jakieś struktury korelacji, lmektóre lmernie są w stanie obsłużyć?
  • Czy jest możliwe / zalecane użycie lmerdanych panelu?

Przepraszam, jeśli są nieco podstawowe.

Trochę więcej szczegółów: w danych panelowych mamy wiele pomiarów tych samych osób w różnych punktach czasowych. Zasadniczo pracuję w kontekście biznesowym, w którym możesz mieć dane dla stałych / długoterminowych klientów przez wiele lat. Chcemy dopuszczać zmienność w czasie, ale wyraźne dopasowanie zmiennej zastępczej dla każdego miesiąca lub roku jest nieefektywne. Nie jestem jednak lmerpewien, czy jest to odpowiednie narzędzie dla tego rodzaju danych, czy też potrzebuję takich struktur autokorelacji lme.

Hong Ooi
źródło
1
Ta odpowiedź jest wciąż aktualna. lmernadal nie radzi sobie z różnorodnością struktur korelacji i wariancji lme, a jak rozumiem sytuację, prawdopodobnie nigdy nie będzie.
Aaron - Przywróć Monikę
@Aaron Dziękuję za odpowiedź. W drugiej części, czy wpływa to na lmerzdolność obsługi zestawu danych panelu? Czy mogę uciec bez przyjęcia konkretnych założeń dotyczących korelacji?
Hong Ooi,
3
@Aaron, nie wiem o tym, że „nigdy nie będę obsługiwał struktur corr / var - jestem zainteresowany dodaniem tych funkcji i nie sądzę, że byłoby to takie trudne - ale z pewnością powiedziałbym:„ nie trzymaj swojego oddech". Nie znam wystarczająco danych panelowych, aby wiedzieć, co byłoby potrzebne, lmeraby je obsłużyć ... Hong, czy możesz dodać krótkie wyjaśnienie do pytania, które bardziej szczegółowo opisuje niezbędne właściwości statystyczne, czy podaje wskazówki?
Ben Bolker
@BenBolker Dodano pewne szczegóły.
Hong Ooi,
4
Powiedziałbym, że lmerbyłby całkiem dobry z losowym efektem roku i losowym efektem klienta (powiedzmy, że masz tylko jeden pomiar na klienta rocznie); jeśli masz ogólny trend czasu (stały efekt), powinieneś również rozważyć losową interakcję między klientami (tj. losowe stoki). Idealnie byłoby również pozwolić na czasową autokorelację w szeregach czasowych każdego klienta, co w tej chwili nie jest możliwe w przypadku Lmer, ale można sprawdzić funkcję czasowej autokorelacji, aby sprawdzić, czy jest to ważne ...
Ben Bolker

Odpowiedzi:

15

AKTUALIZACJA CZERWIEC 2016:

Zobacz wpis na blogu Bena opisujący jego bieżące przemyślenia na temat osiągnięcia tego w lme4: Braindump 01 czerwca 2016 r

Jeśli wolisz metody Bayesa, brmspakiet brmobsługuje niektóre struktury korelacji: strona CRAN brms . (Uwaga: „Począwszy od wersji brms 0.6.0, struktura AR odnosi się do autoregresyjnego efektu reszt, aby dopasować nazewnictwo i implementację w innych pakietach, takich jak nlme. Wcześniej termin AR w brms odwoływał się do autoregresyjnych efektów odpowiedzi. Te ostatnie są teraz nazywane efektami ARR i mogą być modelowane przy użyciu argumentu rw funkcjach cor_arma i cor_arr. ")


ORYGINALNA ODPOWIEDŹ LIPIEC 2013:

(Przekształcony z komentarza).

Powiedziałbym, że lmerbyłby całkiem dobry z losowym efektem roku i losowym efektem klienta (powiedzmy, że masz tylko jeden pomiar na klienta rocznie);

lmer(y~1 + (1|year) + (1|customer), ...)

pasowałby do modelu (tylko przechwytywanie)

ϵ rok ϵ klient

YijNormal(a+ϵyear,i+ϵcustomer,j,σ02)
gdzie i są zerowymi wartościami Normalne zmienne z własnymi specyficznymi wariancjami.ϵyearϵcustomer

Jest to dość nudny model, możesz chcieć dodać ogólny (stały efekt) trend czasu, a także rozważyć losową interakcję między klientami (tj. Losowe nachylenia). Myślę

lmer(y~year + (1|year) + (year|customer), ...)

powinien pasować do modelu

YijNormal((a+ϵcustomer,j)+(b+ϵyear×customer,j)year+ϵyear,i,σ02)

(użycie yearw ten sposób stanowi wyjątek od zwykłej zasady nieuwzględniania zmiennej wejściowej jako efektu dopasowanego i losowego w tym samym modelu; pod warunkiem, że jest to zmienna liczbowa, yearw efekcie stałym jest traktowana jako ciągła i year:customer(losowa) interakcja i jak kategoryczny efekt losowy ...)

Oczywiście możesz chcieć dodać zmienne towarzyszące na poziomie roku, klienta i obserwacji, które pochłonęłyby pewną istotną wariancję (np. Dodać indeks średniej ceny konsumenta, aby wyjaśnić, dlaczego lata były złe lub dobre ...)

Idealnie byłoby również pozwolić na czasową autokorelację w szeregach czasowych każdego klienta, co w tej chwili nie jest możliwe lmer, ale można sprawdzić funkcję czasowej autokorelacji, aby sprawdzić, czy jest to ważne ...

Zastrzeżenie : nie wiem zbyt wiele na temat standardowych metod obsługi danych panelu; opiera się to tylko na mojej wiedzy na temat modeli mieszanych. Komentatorzy (lub redaktorzy) powinni czuć się swobodnie, jeśli wydaje się to naruszać standardowe / najlepsze praktyki w ekonometrii.

Ben Bolker
źródło
O ile nie jest to notacja nieparzysta - zwykle oznacza, że ​​krańcowy rozkład jest normalny ze średnią i wariancją - Myślę, że twoje równania nie są całkiem poprawne. To, co napisałeś, to rozkłady warunkowe, biorąc pod uwagę losowe efekty. Rozkład krańcowy w pierwszym modelu to W drugim model średnia krańcowa to a wariancja jest bardziej skomplikowanym wyrażeniem obejmującym kowariancję między losowym nachyleniem / przecięciem roku a innymi rzeczami. XN(μ,σ2)Xμσ2Yij
N(a,σ02+σyear2+σcust2)
a+byear
Makro
Tak, dzięki Ben. W praktyce byłyby również ustalone skutki, np. Wiek, płeć i wszyscy zwykli podejrzani. @Macro: Uważam, że Ben ma rację.
Hong Ooi
@Macro: Myślę, że notacja jest nieparzysta / nietypowa, ale poprawna (tj. Równoważna z tym, co sugerujesz.) Wyraziłem warunki losowego efektu jako część . Prawdopodobnie byłoby to jaśniejsze / bardziej znane, gdybym napisał to w notacji wielopoziomowej ( ). Y Normalna ( X β + Z u , σ 2 ) ; u MVNormal ( 0 , Σ ) ; Σ = f ( θ )μYNormal(Xβ+Zu,σ2);uMVNormal(0,Σ);Σ=f(θ)
Ben Bolker
1
@BenBolker: czy zauważyłeś, że ustaliłem nagrodę za to pytanie, ponieważ szukam potencjalnej aktualizacji ?
S. Kolassa - Przywróć Monikę
2
Właśnie opublikowałem kilka rzeczy, nad którymi ostatnio pracowałem na rawgit.com/bbolker/mixedmodels-misc/master/notes/… ; Postaram się wprowadzić odpowiednie fragmenty do mojej odpowiedzi (alternatywnie, każdy może albo opublikować swoją odpowiedź na podstawie tych informacji, albo edytować moje pytanie!)
Ben Bolker
3

Aby odpowiedzieć bezpośrednio na twoje pytania, i NB, to lata po oryginalnym poście!

  • Tak, wciąż istnieją struktury korelacji, które nlme obsługuje, których lme4 nie obsłuży. Jednak tak długo, jak nlme pozwala użytkownikowi zdefiniować ogólne ciągi, a lme4 nie, tak będzie. Ma to zaskakująco niewielki wpływ praktyczny. Struktury korelacji „wielkiej trójki”: niezależnych, wymiennych i AR-1 są łatwe w obsłudze dla obu pakietów.

  • Z pewnością jest to możliwe . Za pomocą tej funkcji można również dopasować dane panelu lm! Moje zalecenie, które z nich należy użyć, zależy od problemu. lme4jest znacznie mniejszym zestawem narzędzi, a reprezentacja formuły jest zgrabnym, zwięzłym sposobem przedstawienia niektórych bardzo popularnych modeli efektów mieszanych. nlmeto bardzo duży zestaw narzędzi, w tym spawarka TIG do tworzenia dowolnych narzędzi.

Mówisz, że chcesz zezwolić na „zmiany w czasie”. Zasadniczo osiąga to wymienna struktura korelacji, umożliwiając losowe przechwytywanie w każdym klastrze, tak że wariancja wewnątrz klastra jest sumą zmian na poziomie klastra, a także (jak to nazywacie) zmian w czasie. I to wcale nie zniechęca do korzystania z ustalonych efektów w celu uzyskania bardziej precyzyjnych prognoz w czasie.

AdamO
źródło
1
Hmm Jak zastosować korelację AR-1 w Lme4?
ameba mówi Przywróć Monikę