Zastanawiałem się, czy istnieją jakieś techniki uczenia maszynowego (bez nadzoru) do modelowania danych podłużnych? Zawsze korzystałem z modeli efektów mieszanych (głównie nieliniowych), ale zastanawiałem się, czy istnieją inne sposoby na to (wykorzystanie uczenia maszynowego).
Przez uczenie maszynowe rozumiem losowy las, klasyfikację / grupowanie, drzewa decyzyjne, a nawet głębokie uczenie się itp.
machine-learning
mixed-model
John_dydx
źródło
źródło
Odpowiedzi:
W przypadku, gdy istnieje wiele obserwacji jednego pacjenta (np. Wiele wizyt tego samego pacjenta), wówczas „identyfikator pacjenta” jest zmienną „grupującą”. Podczas oceny modelu należy zachować ostrożność, aby wizyty tego samego pacjenta nie pojawiały się zarówno w danych szkoleniowych, jak i testowych, ponieważ są one skorelowane i doprowadzą do inflacji dokładności klasyfikatora .
Dokumentacja sklearn cross-walidacja ma iteratory krzyżowej walidacji danych zgrupowanych. Zobacz GroupKFold , LeaveOneGroupOut i LeavePGroupsOut .
Jeszcze lepiej, spróbuj Rekurencyjne sieci neuronowe lub ukryte modele Markowa .
źródło
Możesz modelować swoją podłużność za pomocą standardowych metod uczenia maszynowego, po prostu dodając funkcje, które reprezentują długość, np. Dodając funkcję, która reprezentuje czas. Lub funkcja wskazująca członkostwo w grupie, osobie itp. (W przypadku danych panelu).
Jeśli jesteś kreatywny w tworzeniu / wydobywaniu funkcji, możesz modelować wszystko za pomocą algorytmów ML.
źródło