Mam dane dotyczące populacji wielu różnych ryb, z których pobierano próbki przez okres około 5 lat, ale w bardzo nieregularny sposób. Czasami są miesiące między próbkami, czasem jest kilka próbek w ciągu jednego miesiąca. Istnieje również wiele zliczeń 0
Jak radzić sobie z takimi danymi?
Mogę dość łatwo zobrazować go w R, ale wykresy nie są szczególnie pouczające, ponieważ są bardzo nierówne.
Jeśli chodzi o modelowanie - z gatunkami modelowanymi jako funkcja różnych rzeczy - być może model mieszany (inaczej model wielopoziomowy).
Wszelkie referencje lub pomysły są mile widziane
Niektóre szczegóły w odpowiedzi na komentarze
Istnieje około 15 gatunków.
Staram się zarówno zrozumieć jakieś trendy lub sezonowość u każdej ryby, jak i spojrzeć na to, jak gatunki są ze sobą powiązane (mój klient początkowo chciał prostej tabeli korelacji)
Cel jest opisowy i analityczny, a nie przewidywalny
Dalsze edycje: Znalazłem ten artykuł autorstwa K. Rehfielda i in., Który sugeruje użycie jąder Gaussa do oszacowania ACF dla bardzo nieregularnych szeregów czasowych
http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf
Odpowiedzi:
Spędziłem dość czasu, budując ogólne ramy dla nierównomiernie rozłożonych szeregów czasowych: http://www.eckner.com/research.html
Ponadto napisałem artykuł na temat szacowania trendów i sezonowości dla nierównomiernie rozłożonych szeregów czasowych.
Mam nadzieję, że wyniki okażą się pomocne!
źródło
Nie wiem, czy model mieszany jest bardzo odpowiedni (używając standardowych pakietów, w których struktura efektu losowego jest predyktorem liniowym), chyba że uważasz, że dane we wszystkich punktach czasowych powinny być w pewnym sensie wymienialne ze sobą (w takim przypadku nieregularne interwały nie są problemem) - tak naprawdę nie byłoby to modelowanie czasowej autokorelacji w rozsądny sposób. Możliwe, że możesz nakłonić lmer () do zrobienia czegoś autoagresywnego, ale jak dokładnie to zrobisz, teraz mi to umyka (może nie myślę prosto). Nie jestem też pewien, jaka byłaby „zmienna grupująca”, która indukuje autokorelację w scenariuszu modelu mieszanego.
Jeśli czasowa autokorelacja jest uciążliwym parametrem i nie spodziewasz się, że tak będzie teżduże, to możesz podzielić dane na epoki, które są zasadniczo rozłączne względem siebie pod względem korelacji (np. oddzielić szeregi czasowe w punktach, w których nie ma miesięcy żadnych danych) i postrzegać je jako niezależne powtórzenia. Mógłbyś wtedy zrobić coś takiego jak GEE na tym zmodyfikowanym zbiorze danych, w którym „klaster” jest zdefiniowany w jakiej epoce się znajdujesz, a wpisy działającej macierzy korelacji są funkcją odległości od obserwacji. Jeśli funkcja regresji jest prawidłowa, nadal będziesz otrzymywać spójne oszacowania współczynników regresji, nawet jeśli struktura korelacji jest źle określona. Pozwoliłoby to również na zamodelowanie go jako danych zliczających przy użyciu, na przykład, log-link (jak zwykle w regresji Poissona). Możesz także zbudować korelację różnicową między gatunkami, gdzie każdy punkt czasowy jest postrzegany jako wielowymiarowy wektor gatunków, z pewnym czasowo zanikającym związkiem między punktami czasowymi. Wymagałoby to wcześniejszego przetworzenia, aby oszukać standardowe pakiety GEE.
źródło
surveillance
Opakowanie może mieć funkcjonalność pożądane. Tego rodzaju modelowanie nie jest rzadkie w badaniach ekologicznych, więc prawdopodobnie najlepiej jest znaleźć dobry pakiet w ekologicznych zakątkach CRAN.