Bardzo nieregularne szeregi czasowe

10

Mam dane dotyczące populacji wielu różnych ryb, z których pobierano próbki przez okres około 5 lat, ale w bardzo nieregularny sposób. Czasami są miesiące między próbkami, czasem jest kilka próbek w ciągu jednego miesiąca. Istnieje również wiele zliczeń 0

Jak radzić sobie z takimi danymi?

Mogę dość łatwo zobrazować go w R, ale wykresy nie są szczególnie pouczające, ponieważ są bardzo nierówne.

Jeśli chodzi o modelowanie - z gatunkami modelowanymi jako funkcja różnych rzeczy - być może model mieszany (inaczej model wielopoziomowy).

Wszelkie referencje lub pomysły są mile widziane

Niektóre szczegóły w odpowiedzi na komentarze

Istnieje około 15 gatunków.

Staram się zarówno zrozumieć jakieś trendy lub sezonowość u każdej ryby, jak i spojrzeć na to, jak gatunki są ze sobą powiązane (mój klient początkowo chciał prostej tabeli korelacji)

Cel jest opisowy i analityczny, a nie przewidywalny

Dalsze edycje: Znalazłem ten artykuł autorstwa K. Rehfielda i in., Który sugeruje użycie jąder Gaussa do oszacowania ACF dla bardzo nieregularnych szeregów czasowych

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

Peter Flom
źródło
1
Nie jestem odpowiednim facetem, aby odpowiedzieć na twoje pytanie, ale model wielopoziomowy brzmi rozsądnie. Wszelkie wskazówki na temat tego, jak duże są próbki, ile jest gatunków i jak powstaje liczba zerowa? (W ostatnim punkcie, czy próby są próbkami losowych próbek, czy są one stronnicze, tak jak właśnie otrzymałeś wyniki z zawodów w połowach basu, które prawdopodobnie nie przyniosą żadnego suma?)
Wayne
1
„Radzenie sobie” oznacza dokładnie, co? Kilka pomysłów na temat radzenia sobie z nieregularnymi
porami
Czy możesz wyjaśnić próbkowanie i cel? Na przykład czy to przechwytywanie-przechwytywanie? Czy jest to sieć umieszczona w strumieniu na określony czas bez uwolnienia? Czy próbujesz oszacować przyszłe wielkości próby lub większą populację, z której zostanie pobrana próbka? Czy próbki pochodzą z 1 czy wielu lokalizacji? Nie ma nic złego w nieregularnych szeregach czasowych, ale trochę trudno jest zrozumieć związek między zdarzeniami próbkowania oraz między próbkami a jakąś zmienną docelową (np. Odpowiedzią modelu). Czy cel ma również charakter predykcyjny czy opisowy?
Iterator
2
Dlaczego ktoś głosował na to pytanie? Dlaczego nie spróbować pomóc w opracowaniu lepszego pytania lub odpowiedzi?
Iterator,
2
@Iterator Ponieważ nawet teraz, po „dalszych edycjach”, nie ma tutaj jasnego pytania. Głosowanie (dostarczone po braku odpowiedzi na mój pierwszy komentarz) zostało umieszczone, aby zachęcić PO do zapewnienia niezbędnych ulepszeń, a także sygnał o tylko częściowo uformowanym stanie pytania w jego obecnej formie. Zgadywanie, co jest zamierzone, nie jest zadaniem każdego czytelnika (ani modów).
Whuber

Odpowiedzi:

10

Spędziłem dość czasu, budując ogólne ramy dla nierównomiernie rozłożonych szeregów czasowych: http://www.eckner.com/research.html

Ponadto napisałem artykuł na temat szacowania trendów i sezonowości dla nierównomiernie rozłożonych szeregów czasowych.

Mam nadzieję, że wyniki okażą się pomocne!

Andreas Eckner
źródło
5
Dzięki! Ta analiza była dawno temu i już tego nie robię, ale podobne rzeczy mogą pojawić się ponownie; a inni często przeszukują te wątki, więc twój komentarz nie jest marnowany.
Peter Flom
Dzięki za informację (i rzeczywiście lata później ktoś tego szuka w Internecie!), Ale link zniknął.
Hooked
2

Nie wiem, czy model mieszany jest bardzo odpowiedni (używając standardowych pakietów, w których struktura efektu losowego jest predyktorem liniowym), chyba że uważasz, że dane we wszystkich punktach czasowych powinny być w pewnym sensie wymienialne ze sobą (w takim przypadku nieregularne interwały nie są problemem) - tak naprawdę nie byłoby to modelowanie czasowej autokorelacji w rozsądny sposób. Możliwe, że możesz nakłonić lmer () do zrobienia czegoś autoagresywnego, ale jak dokładnie to zrobisz, teraz mi to umyka (może nie myślę prosto). Nie jestem też pewien, jaka byłaby „zmienna grupująca”, która indukuje autokorelację w scenariuszu modelu mieszanego.

Jeśli czasowa autokorelacja jest uciążliwym parametrem i nie spodziewasz się, że tak będzie teżduże, to możesz podzielić dane na epoki, które są zasadniczo rozłączne względem siebie pod względem korelacji (np. oddzielić szeregi czasowe w punktach, w których nie ma miesięcy żadnych danych) i postrzegać je jako niezależne powtórzenia. Mógłbyś wtedy zrobić coś takiego jak GEE na tym zmodyfikowanym zbiorze danych, w którym „klaster” jest zdefiniowany w jakiej epoce się znajdujesz, a wpisy działającej macierzy korelacji są funkcją odległości od obserwacji. Jeśli funkcja regresji jest prawidłowa, nadal będziesz otrzymywać spójne oszacowania współczynników regresji, nawet jeśli struktura korelacji jest źle określona. Pozwoliłoby to również na zamodelowanie go jako danych zliczających przy użyciu, na przykład, log-link (jak zwykle w regresji Poissona). Możesz także zbudować korelację różnicową między gatunkami, gdzie każdy punkt czasowy jest postrzegany jako wielowymiarowy wektor gatunków, z pewnym czasowo zanikającym związkiem między punktami czasowymi. Wymagałoby to wcześniejszego przetworzenia, aby oszukać standardowe pakiety GEE.

Ys,Ytu,v

doov(Ys,Yt)=faθ(s,t,u,v)

faθ

Makro
źródło
Dzięki @macro. Myślę , że model mieszany może być OK, ponieważ często są one używane do danych zagnieżdżonych w czasie; Modelowanie autokorelacji nie interesuje mnie tak bardzo - to jest uciążliwe. Zgadzam się, że czas nie będzie liniowy, ale mogę dodawać efekty czasu (nie jestem pewien, które jeszcze, ale mogę to zbadać). Nie mam MPLUS, ale mam R i SAS.
Peter Flom
1
Mówię tylko, że standardowy model mieszany może nie być odpowiedni w tej sytuacji. Losowe przechwytywanie jest bezużyteczne, jeśli nie sądzisz, że punkty czasowe można wymieniać pod względem korelacji (tzn. Oferowałoby jedynie przybliżenie w świecie „wymiennej korelacji” do twojej prawdziwej struktury korelacji). Uwzględnienie losowych zboczy w czasie wskazuje, że uważasz, że trajektoria „zmierza gdzieś” w czasie - ponieważ fabuła nie była dla ciebie zbyt pouczająca, prawdopodobnie tak się nie dzieje. Przyznaję, że możesz być w stanie nakłonić lmer () do zrobienia czegoś bardziej odpowiedniego.
Makro
2
+1 Dobra, zwięzła odpowiedź na wszystkie najważniejsze kwestie, o których pomyślałam, i wiele więcej. Jeśli chodzi o pakiety w R, wyszukiwanie CRAN przez Google dla [poison regression temporal] pokazuje kilka pakietów. surveillanceOpakowanie może mieć funkcjonalność pożądane. Tego rodzaju modelowanie nie jest rzadkie w badaniach ekologicznych, więc prawdopodobnie najlepiej jest znaleźć dobry pakiet w ekologicznych zakątkach CRAN.
Iterator