Interpretowanie wariancji efektu losowego w blasku

13

Przeglądam artykuł na temat zapylania, w którym dane są dystrybuowane dwumianowo (owoce dojrzewają lub nie). Użyłem więc glmerz jednym losowym efektem (pojedyncza roślina) i jednym stałym efektem (leczenie). Recenzent chce wiedzieć, czy roślina miała wpływ na zbiór owoców - ale mam problem z interpretacją glmerwyników.

Czytałem w Internecie i wydaje się, że mogą występować problemy z bezpośrednim porównywaniem glmi glmermodelami, więc tego nie robię. Uznałem, że najprostszym sposobem odpowiedzi na pytanie byłoby porównanie wariancji efektu losowego (1.449, poniżej) z wariancją całkowitą lub wariancją wyjaśnioną przez leczenie. Ale jak obliczyć te inne wariancje? Nie wydają się być uwzględnione w wynikach poniżej. Przeczytałem coś o tym, że resztkowe wariancje nie są uwzględnione dla dwumianu glmer- jak interpretować względną ważność losowego efektu?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509
jwb4
źródło

Odpowiedzi:

12

Podczas gdy uzyskanie analogii „wariancji proporcji wyjaśnionej przez każdy efekt” jest w zasadzie możliwe dla GLMM, istnieje kilka komplikujących czynników (które poziomy modelu uznajesz za „wariancję całkowitą” i jak kwantyfikujesz wariancję próbkowania ze względu na najniższy poziom [dwumianowy w tym przypadku] rozkład próbkowania)? Nakagawa i Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) przedstawiają ogólne podejście do obliczania R ^ 2 (wyjaśnionego odsetka całkowitej wariancji) dla (G) LMM, które stały się bardzo popularne w ekologii; Xu i in. 2003przyjąć podobne podejście. Zasadniczo podejście to można prawdopodobnie rozszerzyć, aby uwzględnić proporcję wariancji wyjaśnioną różnymi terminami [ale należy zauważyć, że „proporcja wariancji” wszystkich terminów w tak rozważanym modelu prawdopodobnie nie sumowałaby się do 100% - mogłaby bądź mniej więcej].

4σ-1,96σ+1,96σ

Naocznie:

wprowadź opis zdjęcia tutaj

Ben Bolker
źródło
R2)
1
Mówiłem tylko, że nie uważam tego za szalone lub niekoniecznie źle postawione pytanie. Ale zarówno struktura hierarchiczna, jak i modele podobne do GLM otwierają puszki robaków, co utrudnia wybór odpowiedzi. Zwykle nie zawracam sobie tym głowy, ale rozumiem, dlaczego ludzie chcą próbować znaleźć liczby, które mierzą dobroć dopasowania lub względną ważność terminów w modelu, w rozsądny sposób.
Ben Bolker
To uzasadnione. A tak przy okazji, co sądzisz o mojej sugestii, że w / 10 roślin, 3 zabiegi i N = 30, OP może pasować do modelu, stosując oba jako ustalone efekty? Niekoniecznie uważam, że byłby to właściwy model końcowy, ale wydaje mi się, że jest to potencjalnie dopuszczalny sposób sprawdzenia, czy istnieje różnica między roślinami, i postawienia obu zmiennych na podobnej podstawie do porównania.
Gung - Przywróć Monikę
wydaje mi się rozsądne.
Ben Bolker
Pasuję do modelu, w którym zarówno leczenie, jak i roślina mają ustalone efekty, jak sugerował gung, a termin roślina miał bardzo wysoką wartość p (p = 0,3). Czy wydaje się to dziwne, biorąc pod uwagę, że, jak pan mówi, „szacowane odchylenie standardowe między roślinami wynosi 1,20, bardzo blisko wielkości największego efektu leczenia (-1,18)”? Dlaczego miałoby być tak mało znaczące w ANOVA z 2 ustalonymi efektami?
jwb4
3

PlantID0

W twoim przypadku masz wiele miar na roślinę, więc jednym szybkim i brudnym podejściem jest uruchomienie modelu ze PlantIDstałym efektem i przetestowanie tego efektu.

gung - Przywróć Monikę
źródło
1

Prosta odpowiedź dla recenzenta brzmi: „Tak”. Jeśli poprosi cię o sprawdzenie, czy wariancja efektu losowego różni się znacząco od 0, masz kilka opcji. Zauważ jednak, że wielu inteligentnych ludzi nie czuje się komfortowo podczas testowania, jeśli wariancje efektów losowych są różne od 0.

Najprostszy jest testem prawdopodobieństwa, choć nie jest zalecany przez większość. Są bardzo konserwatywne podczas testowania na granicach (tj. Testujesz względem wariancji 0, która jest tak niska, jak to tylko możliwe). Istnieje ogólna zasada, że ​​wartość p jest około dwa razy większa niż w rzeczywistości.

Metodą zalecaną w większości miejsc jest parametryczny bootstrap. Możesz użyć bootMerz lme4pakietu. Upewnij się, że ustawiłeś parametr REML funkcji lmer na FAŁSZ, w przeciwnym razie Twoja wariancja będzie większa niż 0 100% czasu (lub blisko niej ... w rzeczywistości prawdopodobnie będzie większa niż 0 prawie 100% czas i tak).

Kilka wskazówek i dalszych zasobów:

http://glmm.wikidot.com/faq (znajdź nagłówek Jak sprawdzić, czy losowy efekt jest znaczący?)

lmer () parametryczne testowanie bootstrap dla ustalonych efektów

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/

le_andrew
źródło
Dzięki za ten przejrzysty (i szybki!) Przewodnik po porównaniu modeli. Ale jak interpretowałbym „wielkość” efektu zmiennej losowej? tzn. jak porównać wariancję wyjaśnioną przez moją zmienną losową z wariancją wyjaśnioną przez zmienną stałą (leczenie)? Chyba nie rozumiem, jak to się zbiera z wyników testu LRT bootstrapped.
jwb4
0

W teście Q testu Cochrana z wieloma próbkami używają anova do porównania wyników dwóch modeli (jednego bez efektów losowych i jednego z efektami losowymi).

Jairo Rocha University of Balearic

Jairo Rocha
źródło