Kontekst :
Wyobraź sobie, że miałeś badanie podłużne, w którym mierzono zmienną zależną (DV) raz w tygodniu przez 20 tygodni na 200 uczestnikach. Chociaż ogólnie interesuje mnie, typowe DV, o których myślę, obejmują wyniki pracy po zatrudnieniu lub różne środki dobrostanu po interwencji psychologii klinicznej.
Wiem, że modelowanie wielopoziomowe może być wykorzystane do modelowania związku między czasem a DV. Możesz także pozwolić, aby współczynniki (np. Przechwyty, zbocza itp.) Różniły się między poszczególnymi osobami i oszacowały określone wartości dla uczestników. Ale co, jeśli podczas wizualnej inspekcji danych okaże się, że związek między czasem a DV jest jednym z poniższych:
- różnią się formą funkcjonalną (być może niektóre mają charakter liniowy, a inne mają charakter wykładniczy, a niektóre mają nieciągłość)
- różna wariancja błędu (niektóre osoby są bardziej zmienne z jednego punktu czasowego do następnego)
Pytania :
- Jaki byłby dobry sposób na podejście do modelowania danych w ten sposób?
- W szczególności, jakie podejścia są dobre w identyfikowaniu różnych rodzajów relacji i kategoryzowaniu osób pod względem ich typu?
- Jakie implementacje istnieją w R dla takich analiz?
- Czy są jakieś odniesienia, jak to zrobić: podręcznik lub faktyczna aplikacja?
źródło
Poleciłbym rzucić okiem na kilka artykułów autorstwa Hepinga Zhanga, używając adaptacyjnych splajnów do modelowania danych podłużnych:
Ponadto zobacz stronę MASAL dotyczącą oprogramowania, w tym pakietu R.
źródło
Wydaje mi się, że modele mieszanki wzrostu mogą potencjalnie pozwolić ci zbadać wariancję błędu. ( Tutaj PDF ). (Nie jestem pewien, jakie są multiplikatywne modele heteroscedastyczne, ale na pewno będę musiał je sprawdzić).
Modele trajektorii oparte na utajonych grupach stały się ostatnio bardzo popularne w kryminologii. Ale wiele osób po prostu przyjmuje za pewnik, że grupy faktycznie istnieją, a niektóre sprytne badania wykazały, że grupy można znaleźć nawet w przypadkowych danych. Należy również zauważyć, że podejście do modelowania oparte na grupach Nagina nie pozwala ocenić błędu (i szczerze mówiąc, nigdy nie widziałem modelu, który wyglądałby jak nieciągłość).
Chociaż byłoby to trudne z 20 punktami czasowymi, pomocne może być opracowanie prostych heurystyk w celu identyfikacji wzorców (np. Zawsze niski lub zawsze wysoki współczynnik zmienności). Widzę wykresy przebiegu w czasie w arkuszu kalkulacyjnym lub wykresach współrzędnych równoległych, ale wątpię, aby były one pomocne (szczerze mówiąc, nigdy nie widziałem wykresu współrzędnych, który jest bardzo pouczający).
Powodzenia
źródło
Cztery lata po zadaniu tego pytania nauczyłem się kilku rzeczy, więc może powinienem dodać kilka pomysłów.
Myślę, że bayesowskie modelowanie hierarchiczne zapewnia elastyczne podejście do tego problemu.
Oprogramowanie : narzędzia takie jak jags, stan, WinBugs itp. Potencjalnie w połączeniu z ich odpowiednimi pakietami interfejsu R (np. Rjags, rstan) ułatwiają określenie takich modeli.
Różnice w obrębie błędu osoby: Modele bayesowskie ułatwiają określenie wariancji błędu osoby jako czynnika losowego, który różni się między ludźmi.
Zatem odchylenie standardowe każdej osoby może być modelowane jako rozkład gamma. Przekonałem się, że jest to ważny parametr w wielu domenach psychologicznych, w których ludzie różnią się tym, jak bardzo różnią się w czasie.
Utajone klasy krzywych: Nie zgłębiałem jeszcze tego pomysłu, ale stosunkowo łatwo jest określić dwie lub więcej możliwych funkcji generowania danych dla każdej osoby, a następnie pozwolić modelowi Bayesian wybrać model najbardziej prawdopodobny dla danej osoby. W ten sposób zazwyczaj otrzymujesz prawdopodobieństwo tylne dla każdej osoby w odniesieniu do tego, która forma funkcjonalna opisuje dane osób.
Jako szkic pomysłu na model możesz mieć coś takiego:
źródło
John Fox ma świetny dodatek dostępny on-line za pomocą nlme do przeglądania danych podłużnych. Może ci się przydać:
http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf
Jest tam wiele świetnych rzeczy (a książki Foxa są ogólnie całkiem dobre!).
źródło