Zasadniczo zastanawiam się, w jaki sposób wymuszane są różne struktury kowariancji i jak obliczane są wartości w tych macierzach. Funkcje takie jak lme () pozwalają nam wybrać, którą strukturę chcielibyśmy, ale chciałbym wiedzieć, jak są szacowane.
Rozważ liniowy model efektów mieszanych .
Gdzie i . Ponadto:
Dla uproszczenia założymy .
Zasadniczo moje pytanie brzmi: jak dokładnie szacuje się na podstawie danych dla różnych parametryzacji? Powiedzmy, że jeśli założymy, że jest diagonalny (efekty losowe są niezależne) lub pełni sparametryzowany (w tej chwili bardziej mnie to interesuje) lub dowolne inne parametry? Czy istnieją dla nich proste estymatory / równania? (Bez wątpienia byłoby to iteracyjnie szacowane).
EDYCJA: Z książki Variance Components (Searle, Casella, McCulloch 2006) udało mi się uzyskać następujące informacje:
Jeśli to składniki wariancji są aktualizowane i obliczane w następujący sposób:
Gdziei U (k)sąth aktualizacjach odpowiednio.
Czy istnieją ogólne wzory, gdy jest blokowo ukośne lub w pełni sparametryzowane? Zgaduję, że w przypadku w pełni sparametryzowanym stosuje się rozkład Cholesky'ego, aby zapewnić pozytywną definitywność i symetrię.
Odpowiedzi:
Plik Goldstein .pdf @probabilityislogic to świetny dokument. Oto lista niektórych odniesień omawiających Twoje pytanie:
Harville, 1976: Rozszerzenie twierdzenia Gaussa-Markowa o oszacowanie efektów losowych .
Harville, 1977: Podejście maksymalnego prawdopodobieństwa do oszacowania komponentu wariancji i powiązanych problemów .
Laird and Ware, 1982: Modele efektów losowych dla danych podłużnych .
McCulloch, 1997: Algorytmy maksymalnego prawdopodobieństwa dla uogólnionych liniowych modeli mieszanych .
Fragment Podręcznika użytkownika SAS dotyczący procedury MIESZANE zawiera kilka świetnych informacji na temat szacowania kowariancji i wielu innych źródeł (od strony 3968).
Istnieje wiele wysokiej jakości podręczników na temat analizy danych z pomiarów podłużnych / powtarzanych, ale oto jeden, który szczegółowo opisuje implementację w języku R (od autorów
lme4
inlme
):Pinheiro i Bates, 2000: Modele z efektami mieszanymi w S i S-PLUS .
EDYCJA : Jeszcze jeden istotny artykuł: Lindstrom i Bates, 1988: Newton-Raphson i EM Algorytmy dla liniowych modeli efektów mieszanych dla danych z powtarzanymi pomiarami .
EDYCJA 2 : I kolejne: Jennrich i Schluchter, 1986: Niezrównoważone modele z powtarzanymi pomiarami ze strukturalnymi macierzami kowariancji .
źródło
lme4
i zobaczyć, jak radzi sobie z tym oszacowaniem.Harvey Goldstein nie jest złym miejscem do rozpoczęcia.
Podobnie jak w przypadku najbardziej złożonych metod szacowania, różni się w zależności od pakietu oprogramowania. Często jednak wykonuje się następujące czynności:
Jedną z prostych i szybkich metod jest IGLS, która polega na iteracji między dwiema procedurami najmniejszych kwadratów i jest szczegółowo opisana w rozdziale drugim. Minusem jest to, że nie działa dobrze dla składników wariancji bliskich zeru.
źródło
Poniższy artykuł zawiera zamknięte rozwiązanie dla D:
źródło
jeszcze dwa odniesienia, które mogą być przydatne Składniki wariancji Searle i in. oraz Lynch i Walsh Genetyka i analiza cech ilościowych . Książka Lyncha i Walsha zawiera algorytm krok po kroku, jeśli dobrze pamiętam
źródło