Kontekst
Chcę ustawić scenę, zanim nieco rozwinę pytanie.
Mam dane podłużne, pomiary wykonywane na osobach co około 3 miesiące, pierwotny wynik jest liczbowy (jak ciągły do 1dp) w zakresie od 5 do 14, a większość (wszystkich punktów danych) wynosi od 7 do 10. Jeśli zrobię wykres spaghetti (z wiekiem na osi x i linią dla każdej osoby) to oczywiście bałagan, ponieważ mam> 1500 przedmiotów, ale istnieje wyraźny krok w kierunku wyższych wartości wraz ze wzrostem wieku (i jest to znane).
Szersze pytanie: Chcielibyśmy przede wszystkim być w stanie zidentyfikować grupy trendów (te, które zaczynają się wysoko i pozostają na wysokim poziomie, te, które zaczynają się na niskim poziomie i pozostają na niskim poziomie, te, które zaczynają się na niskim poziomie i rosną na wysokim poziomie itp.) przyjrzyj się poszczególnym czynnikom związanym z członkostwem w „grupie trendów”.
Moje pytanie dotyczy konkretnie pierwszej części, grupowania według trendów.
Pytanie
- Jak możemy grupować indywidualne trajektorie wzdłużne?
- Jakie oprogramowanie byłoby odpowiednie do wdrożenia tego?
Spojrzałem na Proc Traja w SAS i M-Plus zasugerowany przez kolegę, którego szukam, ale chciałbym wiedzieć, jakie są na ten temat myśli innych.
źródło
kml
pakiet - wydaje się, że zapewnia funkcjonalność, której potrzebujesz. Artykuł w JoSS szczegółowo to opisuje. Równieżkml3d
ikmlShape
może być interesujące.Odpowiedzi:
Użyłem Mfuzz w R do grupowania zestawów danych mikromacierzy przebiegu czasowego. Mfuzz używa „miękkiego klastrowania”. Zasadniczo osoby mogą występować w więcej niż jednej grupie.
Jak wskazuje @Andy w komentarzu, oryginalny artykuł wykorzystuje dane CTN. Podejrzewam jednak, że powinno działać OK dla twoich dyskretnych danych. Zwłaszcza, że właśnie eksplorujesz zestaw danych. Oto szybki przykład w R:
Daje następujący wykres:
źródło
Spodziewałbym się, że jest pakiet MPLUS do robienia tego, czego potrzebujesz. W Psychometrze jest artykuł na prawie dokładnie ten temat
springerlink.com/content/25r110007g417187
z wyjątkiem danych binarnych, a trajektorie są trajektoriami prawdopodobieństwa. Autorzy wykorzystują ukrytą analizę klas (zaimplementowaną za pomocą karanego modelu skończonej mieszanki) do grupowania trajektorii. Wiem też, że pierwszy autor około 10 lat temu napisał kilka innych artykułów z Bengtem Muthenem (twórcą MPLUS) na temat analizy ukrytych klas w podobnych ustawieniach (z trajektoriami). Na przykład,
http://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.1999.00463.x/abstract
brzmi bardzo podobnie do tego, o czym mówisz, ale wynik jest binarny. Ciągły przypadek jest znacznie prostszy, dlatego przeszukałbym literaturę wstecz (tj. Spojrzałem na dokumenty, do których odnoszą się te dokumenty), aby znaleźć coś, co pasuje do tego, co opisałeś dokładniej.
Aby dowiedzieć się więcej, możesz bezpośrednio zapytać właścicieli MPLUS, jakiego pakietu należy użyć, aby zrobić to, czego potrzebujesz. Zazwyczaj reagują bardzo szybko i są bardzo pomocne:
http://www.statmodel.com/cgi-bin/discus/discus.cgi
źródło