Pułapki liniowych modeli mieszanych

18

Jakie są niektóre z głównych pułapek korzystania z liniowych modeli mieszanych efektów? Jakie są najważniejsze rzeczy do przetestowania / na które należy zwrócić uwagę przy ocenie odpowiedniości modelu? Porównując modele tego samego zestawu danych, jakie są najważniejsze rzeczy, których należy szukać?

Alan H.
źródło

Odpowiedzi:

16

To dobre pytanie.

Oto niektóre typowe pułapki:

  1. Stosując standardową teorię prawdopodobieństwa, możemy wyprowadzić test, aby porównać dwie zagnieżdżone hipotezy, i , obliczając statystyki testu prawdopodobieństwa. Rozkład zerowy tej statystyki testowej jest w przybliżeniu chi-kwadrat o stopniach swobody równych różnicy wymiarów przestrzeni dwóch parametrów. Niestety, ten test jest jedynie przybliżony i wymaga kilku założeń. Jednym z kluczowych założeń jest to, że parametry poniżej wartości zerowej nie znajdują się na granicy przestrzeni parametrów. Ponieważ często jesteśmy zainteresowani testowaniem hipotez na temat losowych efektów, które przybierają postać: To jest prawdziwa obawa.H0H1

    H0:σ2=0
    Rozwiązaniem tego problemu jest użycie REML. Jednak wartości p będą zwykle większe niż powinny. Oznacza to, że jeśli zaobserwujesz znaczący efekt przy użyciu przybliżenia χ2, możesz być całkiem pewny, że jest on rzeczywiście znaczący. Małe, ale nieistotne, wartości p mogą zachęcić do korzystania z bardziej dokładnych, ale czasochłonnych metod ładowania początkowego.
  2. Porównywanie ustalonych efektów: Jeśli planujesz użyć testu współczynnika wiarygodności do porównania dwóch zagnieżdżonych modeli, które różnią się tylko ustalonymi efektami, nie możesz użyć metody szacowania REML. Powodem jest to, że REML szacuje efekty losowe, biorąc pod uwagę liniowe kombinacje danych, które usuwają ustalone efekty. Jeśli te ustalone efekty zostaną zmienione, prawdopodobieństwo tych dwóch modeli nie będzie bezpośrednio porównywalne.

  3. Wartości p: Wartości p wygenerowane przez test współczynnika prawdopodobieństwa dla ustalonych efektów są przybliżone i niestety wydają się być zbyt małe, tym samym niekiedy przeceniając znaczenie niektórych efektów. Możemy użyć nieparametrycznych metod ładowania początkowego, aby znaleźć dokładniejsze wartości p dla testu współczynnika wiarygodności.

  4. Istnieją inne obawy dotyczące wartości p dla testu efektów stałych, które zostały podkreślone przez dr Douga Batesa [ tutaj ].

Jestem pewien, że inni członkowie forum będą mieli lepsze odpowiedzi.

Źródło: Rozszerzenie modeli liniowych o R - Dr. Julain Faraway.

suncoolsu
źródło
9

Częstą pułapką, którą widzę, jest ignorowanie wariancji efektów losowych. Jeśli jest duża w porównaniu do wariancji rezydualnej lub wariancji zmiennej zależnej, dopasowanie zwykle wygląda ładnie, ale tylko dlatego, że wszystkie wariancje odpowiadają efektom losowym. Ale ponieważ wykres rzeczywistej vs przewidywanej wygląda ładnie, jesteś skłonny myśleć, że twój model jest dobry.

Wszystko się rozpada, gdy taki model jest używany do przewidywania nowych danych. Zwykle wtedy można użyć tylko stałych efektów, a dopasowanie może być bardzo słabe.

mpiktas
źródło
6

Modelowanie struktury wariancji jest prawdopodobnie najpotężniejszą i najważniejszą pojedynczą cechą modeli mieszanych. Wykracza to poza strukturę wariancji i obejmuje korelację między obserwacjami. Należy zadbać o zbudowanie odpowiedniej struktury kowariancji, w przeciwnym razie testy hipotez, przedziały ufności i szacunki średnich metod leczenia mogą nie być prawidłowe. Często potrzeba znajomości eksperymentu, aby określić prawidłowe efekty losowe.

SAS dla modeli mieszanych to moje przejście do zasobów, nawet jeśli chcę przeprowadzić analizę w R.

Dolina górska
źródło