Mam następujące dane wyjściowe:
Generalized linear mixed model fit by the Laplace approximation
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape)
AIC BIC logLik deviance
4062 4093 -2022 4044
Random effects:
Groups Name Variance Std.Dev.
landscape (Intercept) 0.82453 0.90804
Number of obs: 239, groups: landscape, 45
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.65120 0.14051 18.868 <2e-16
sMFS2 0.26922 0.17594 1.530 0.1260
sAG2 0.09268 0.14529 0.638 0.5235
sSHDI2 0.28345 0.17177 1.650 0.0989
sbare 0.41388 0.02976 13.907 <2e-16
seasonlate -0.50165 0.02729 -18.384 <2e-16
cropforage 0.79000 0.06724 11.748 <2e-16
cropsoy 0.76507 0.04920 15.551 <2e-16
Correlation of Fixed Effects:
(Intr) sMFS2 sAG2 sSHDI2 sbare sesnlt crpfrg
sMFS2 -0.016
sAG2 0.006 -0.342
sSHDI2 -0.025 0.588 -0.169
sbare -0.113 -0.002 0.010 0.004
seasonlate -0.034 0.005 -0.004 0.001 -0.283
cropforage -0.161 -0.005 0.012 -0.004 0.791 -0.231
cropsoy -0.175 -0.022 0.013 0.013 0.404 -0.164 0.557
Wszystkie moje ciągłe zmienne (oznaczone jako małe s
przed nazwą zmiennej) są znormalizowane (z-score). season
jest zmienną jakościową z 2 poziomami (wczesną i późną) i crop
jest zmienną jakościową z 3 poziomami (kukurydza, pasza i soja).
Ta korelacja macierzy efektów stałych jest dla mnie bardzo myląca, ponieważ wszystkie korelacje mają odwrotny znak, jaki mają, gdy patrzę na proste regresje par zmiennych. tj. korelacja macierzy efektów stałych sugeruje silną korelację dodatnią między, cropforage
a sbare
gdy w rzeczywistości istnieje bardzo silna korelacja NEGATYWNA między tymi zmiennymi - rośliny pastewne miały zwykle znacznie mniej gołej ziemi w porównaniu z uprawami kukurydzy i soi. Pary zmiennych ciągłych mają ten sam problem, korelacja macierzy efektów stałych mówi, że wszystko jest przeciwieństwem tego, czym powinno być ... Czy może to być spowodowane złożonością modelu (a nie prostą regresją)? Czy to może mieć coś wspólnego z faktem, że zmienne są znormalizowane?
Dzięki.
Jeśli twoje ujemne i dodatnie korelacje mają tę samą wartość i różni się tylko ich znak, wpisujesz zmienną błędnie. Ale nie sądzę, że tak jest w przypadku ciebie, ponieważ wydajesz się już dość zaawansowany w statystykach.
Występująca niespójność może być i jest prawdopodobnie spowodowana wielokoliniowością. Oznacza to, że niektóre niezależne zmienne mają wspólne nakładające się efekty lub innymi słowy są skorelowane . na przykład modelowanie do zmiennych „tempo wzrostu” i „rozmiar guza” może powodować wielokoliniowość, ponieważ jest to możliwe i prawdopodobne, że większe guzy mają wyższe wskaźniki wzrostu (zanim zostaną wykryte) per se. To może mylić model. A jeśli twój model ma kilka niezależnych zmiennych, które są ze sobą skorelowane, interpretacja wyników może czasem stać się dość trudna. Czasami prowadzi to do zupełnie dziwnych współczynników, nawet do takich rozmiarów, że odwraca się znak niektórych korelacji.
Najpierw powinieneś wykryć źródła wielokoliniowości i zająć się nimi, a następnie ponownie przeprowadzić analizę.
źródło
Pomocne może okazać się wykazanie, że te korelacje między stałymi efektami są uzyskiwane przez konwersję „vcov” modelu na macierz korelacji. Jeśli
fit
to twój dopasowany model Lme4, toa korelacje między stałymi efektami są zapisami o przekątnej.
źródło