Załóżmy, że mam jakąś zmienną odpowiedzi która została zmierzona od j- tego rodzeństwa w i- tej rodzinie. Ponadto niektóre dane behawioralne x i j zebrano w tym samym czasie od każdego pacjenta. Próbuję przeanalizować sytuację za pomocą następującego liniowego modelu mieszanych efektów:
gdzie i α 1 oznaczają odpowiednio stały punkt przecięcia i nachylenie, δ 1 i jest nachyleniem losowym, a ε i j jest wartością resztkową.
Założenia dla efektów losowych oraz resztkowego ε i j są (przy założeniu, że w każdej rodzinie jest tylko dwoje rodzeństwa)
gdzie jest nieznanym parametrem wariancji, a struktura wariancji-kowariancji R jest symetryczną macierzą formy 2 x 2
który modeluje korelację między dwojgiem rodzeństwa.
Czy jest to odpowiedni model dla takiego rodzeństwa?
Dane są nieco skomplikowane. Spośród 50 rodzin blisko 90% z nich to bliźnięta dizygotyczne (DZ). Dla pozostałych rodzin
- dwoje ma tylko jedno rodzeństwo;
- dwa mają jedną parę DZ i jedno rodzeństwo; i
- dwa mają jedną parę DZ i dwa dodatkowe rodzeństwo.
Wierzę,
lme
że pakiet Rnlme
może łatwo poradzić sobie (1) z brakującą lub niezrównoważoną sytuacją. Mam problem z tym, jak sobie radzić z (2) i (3)? Jedną z możliwości, jaką mogę wymyślić, jest podzielenie każdej z tych czterech rodzin w (2) i (3) na dwie części, tak aby każda podrodzina miała jedno lub dwoje rodzeństwa, tak aby powyższy model mógł być nadal stosowany. Czy to w porządku? Inną opcją byłoby po prostu wyrzucenie danych z dodatkowego jednego lub dwóch rodzeństwa w (2) i (3), co wydaje się marnotrawstwem. Jakieś lepsze podejścia?Wydaje się, że
lme
pozwala to ustalić wartości pozostałej macierzy wariancji-kowariancji R , na przykład r 2 12 = 0,5. Czy ma sens narzucanie struktury korelacji, czy powinienem ją po prostu oszacować na podstawie danych?
lme
Odpowiedzi:
Do ujednoliconego modelu można uwzględnić bliźnięta i osoby niebędące bliźniakami, używając zmiennej fikcyjnej i włączając losowe nachylenia w tej zmiennej fikcyjnej. Ponieważ wszystkie rodziny mają co najwyżej jeden zestaw bliźniaków, będzie to stosunkowo proste:
Niech jeśli rodzeństwo j w rodzinieAij=1 j i ηi3
Następnie dopasuj model:
Możesz dopasować model za pomocą
R
pakietulme4
. W kodzie poniżej zmienna zależna to:y
zmiennaA
fikcyjna to predyktor tox
iloczyn zmiennej fikcyjnej, a predyktorem jestAx
ifamID
jest numerem identyfikacyjnym rodziny. Zakłada się, że twoje dane są przechowywane w ramce danychD
, z tymi zmiennymi jak kolumnami.Zmienne losowe i oszacowane efekty stałe można wyświetlić, wpisując
summary(g)
. Zauważ, że ten model pozwala na swobodną korelację między losowymi efektami.W wielu przypadkach bardziej sensowne (lub łatwiejsze do zinterpretowania) może być założenie, że zakłada się niezależność między efektami losowymi (np. Często przyjmuje się założenie, że rozkłada korelację genetyczną i środowiskową w rodzinie), w którym to przypadku należy wpisać
źródło