Szukam porady, w jaki sposób analizować złożone dane ankietowe za pomocą modeli wielopoziomowych w R. Użyłem survey
pakietu do ważenia nierównych prawdopodobieństw wyboru w modelach jednopoziomowych, ale ten pakiet nie ma funkcji do modelowania wielopoziomowego. lme4
Opakowanie jest idealne do modelowania wielopoziomowego, ale nie jest to sposób, że wiem zawierać ciężarów na różnych poziomach grupowania. Asparouhov (2006) ustawia problem:
Modele wielopoziomowe są często używane do analizy danych z projektów próbkowania klastra. Takie projekty próbkowania często jednak wykorzystują nierówne prawdopodobieństwo wyboru na poziomie klastra i na poziomie indywidualnym. Wagi próbkowania są przypisywane na jednym lub obu poziomach, aby odzwierciedlić te prawdopodobieństwa. Jeżeli wagi próbkowania są ignorowane na każdym poziomie, oszacowania parametrów mogą być znacznie tendencyjne.
Jednym podejściem dla modeli dwupoziomowych jest wielopoziomowy estymator pseudo maksymalnego prawdopodobieństwa (MPML), który jest implementowany w MPLUS ( Asparouhov i in.,? ). Carle (2009) dokonuje przeglądu głównych pakietów oprogramowania i przedstawia kilka zaleceń dotyczących dalszego postępowania:
Aby prawidłowo przeprowadzić MLM ze złożonymi danymi ankietowymi i wagami projektowymi, analitycy potrzebują oprogramowania, które może obejmować wagi skalowane poza programem i obejmować „nowe” wagi skalowane bez automatycznej modyfikacji programu. Obecnie pozwalają na to trzy główne programy MLM: Mplus (5.2), MLwiN (2.02) i GLLAMM. Niestety ani HLM, ani SAS nie mogą tego zrobić.
West i Galecki (2013) podają bardziej zaktualizowaną recenzję, a ja zacytuję odpowiedni fragment:
Czasami analitycy chcą dopasować LMM do badania zestawów danych zebranych z próbek o złożonych projektach (patrz Heeringa i in., 2010, rozdział 12). Złożone projekty prób charakteryzują się ogólnie podziałem populacji na warstwy, wieloetapową selekcją skupisk osobników z warstw oraz nierównymi prawdopodobieństwami selekcji zarówno dla skupisk, jak i badanych osobników ostatecznych. Te nierówne prawdopodobieństwa wyboru generalnie prowadzą do konstruowania wag próbkowania dla osób, które zapewniają obiektywne oszacowanie parametrów opisowych po włączeniu do analizy. Wagi te można dodatkowo skorygować o brak odpowiedzi w badaniu i skalibrować do znanych sum populacji. Tradycyjnie, analitycy mogą rozważyć podejście projektowe do włączenia tych złożonych funkcji próbkowania przy szacowaniu modeli regresji (Heeringa i in., 2010). Niedawno statystycy zaczęli badać podejścia modelowe do analizy tych danych, wykorzystując LMM do włączenia stałych efektów warstw próbkowania i losowych efektów próbkowanych klastrów.
Podstawową trudnością związaną z opracowaniem podejść modelowych do analizy tych danych było wybranie odpowiednich metod włączenia wag próbkowania (podsumowanie zagadnień znajduje się w Gelman, 2007). Pfeffermann i in. (1998), Asparouhov i Muthen (2006) oraz Rabe-Hesketh i Skrondal (2006) opracowali teorię szacowania modeli wielopoziomowych w sposób uwzględniający wagi ankiet, a Rabe-Hesketh i Skrondal (2006), Carle (2009) i Heeringa i in. (2010, rozdział 12) przedstawili aplikacje wykorzystujące obecne procedury oprogramowania, ale nadal jest to aktywny obszar badań statystycznych. Procedury oprogramowania zdolne do dopasowania LMM znajdują się na różnych etapach wdrażania podejść zaproponowanych do tej pory w literaturze w celu włączenia złożonych funkcji projektowych, analitycy muszą wziąć to pod uwagę przy dopasowywaniu LMM do złożonych danych z badań ankietowych. Analitycy zainteresowani dopasowaniem LMM do danych zebranych z złożonych badań ankietowych będą zainteresowani procedurami, które są w stanie poprawnie włączyć wagi ankiet do procedur szacunkowych (HLM, MLwiN, Mplus, xtmixed i gllamm), zgodnie z obecną literaturą w tym dokumencie powierzchnia.
To prowadzi mnie do pytania: czy ktoś ma zalecenia dotyczące najlepszych praktyk w zakresie dopasowania LMM do złożonych danych ankietowych w R?
źródło
i've never said it before
od tego postu na temat addhealth, mogą być interesujące .. :(lmer
Funkcja wlme4
pakiecie pozwala specyfikacjęweights
argumentem dla procesu modelu sylwetkę, więc jeśli mają stałe ciężarów projektowych, powinieneś być w stanie włączyć je z tym argumentem. Czy mam tutaj zły koniec kija? Czy jest jakiś powód, dla którego jest to nieodpowiednie?Odpowiedzi:
O ile wiem, w tej chwili tak naprawdę nie możesz tego zrobić w R, jeśli naprawdę potrzebujesz modelu mieszanego (np. Jeśli zależy ci na komponentach wariancji)
Argument wag, aby
lme4::lmer()
nie robić tego, co chcesz, ponieważlmer()
interpretuje wagi jako wagi precyzyjne, a nie jako próbki próbkowania. W przeciwieństwie do zwykłych modeli liniowych i uogólnionych modeli liniowych nie otrzymujesz nawet poprawnych oszacowań punktowych za pomocą kodu, który traktuje wagi próbkowania jako wagi precyzyjne dla modelu mieszanego.Jeśli nie musisz szacować składników wariancji, a chcesz, aby funkcje wielopoziomowe modelu uzyskiwały prawidłowe standardowe błędy, których możesz użyć
survey::svyglm()
.źródło
WeMix pakiet jest teraz opcja, przynajmniej dla liniowych i logistycznych modeli wielopoziomowych. Wydaje się bardzo powolny, w porównaniu do uruchamiania tych modeli w Stata lub MPlus.
źródło
Mam również ten sam problem. Po wielu poszukiwaniach w ciągu ostatnich kilku dni odkryłem, że pakiet BIFIEsurvey jest najbliższy analizie modeli wielopoziomowych ze złożonymi danymi pomiarowymi z próbkami i replikowanymi wagami oraz prawdopodobnymi wartościami: https://cran.r-project.org/web /packages/BIFIEsurvey/index.html Pakiet jest jednak ograniczony do modeli dwupoziomowych. Czytałem również, że autor pakietu „intsvy” planuje w dłuższej perspektywie zrobić „intsvy”, aby móc analizować modele wielopoziomowe, ale na dzień dzisiejszy nadal nie może. Jeśli będzie jakiś postęp w rozwiązaniu tego problemu, który mogłem przypadkowo pominąć, byłbym szczęśliwy, gdyby ktoś mógł go udostępnić.
źródło