Wieloczynnikowe biologiczne szeregi czasowe: VAR i sezonowość

15

Mam wielowymiarowy zestaw danych szeregów czasowych, w tym oddziałujące zmienne biologiczne i środowiskowe (oraz ewentualnie niektóre zmienne egzogeniczne). Oprócz sezonowości w danych nie ma wyraźnego trendu długoterminowego. Moim celem jest sprawdzenie, które zmienne są ze sobą powiązane. Tak naprawdę nie szuka się prognozowania.

Będąc nowym w analizie szeregów czasowych, przeczytałem kilka referencji. O ile rozumiem, odpowiedni byłby wektorowy model autoregresji (VAR), ale nie czuję się dobrze z sezonowością i większość przykładów dotyczyła dziedziny ekonomii (tak często z analizą szeregów czasowych…) bez sezonowości.

Co powinienem zrobić z moimi danymi sezonowymi? Rozważyłem ich odsezonowanie - na przykład w R użyłbym, decomposea następnie użyłem $trend + $randwartości, aby uzyskać sygnał, który wydaje się dość stacjonarny (zgodnie z oceną acf). Wyniki modelu VAR są dla mnie mylące (wybierany jest model 1-lagowy, podczas gdy intuicyjnie oczekiwałbym więcej, i tylko współczynniki dla autoregresji - a nie dla regresji z innymi zmiennymi opóźnionymi - są znaczące). Czy robię coś źle, czy powinienem wyciągnąć wniosek, że moje zmienne nie są (liniowo) powiązane / mój model nie jest dobry (pytanie pomocnicze: czy istnieje nieliniowy odpowiednik VAR?).

[Alternatywnie, przeczytałem, że prawdopodobnie mógłbym użyć fałszywych zmiennych sezonowych, chociaż nie mogę dokładnie dowiedzieć się, jak to zaimplementować].

Sugestie krok po kroku byłyby bardzo mile widziane, ponieważ szczegóły dla doświadczonych użytkowników mogą faktycznie być dla mnie pouczające (a fragmenty kodu R lub linki do konkretnych przykładów są oczywiście bardzo mile widziane).

ztl
źródło
2
Wiele zależy od tego, jak myślisz o sezonowości. Moja niejednolita lektura literatury wskazuje, że ekonomiści często uważają sezonowość za nieciekawą uciążliwość, podczas gdy naukowcy zajmujący się ochroną środowiska często czują się o wiele bardziej pozytywnie. Metoda zmiennych obojętnych stosowana w ekonomii często polega na tym, że dane są kwartalne lub miesięczne, a skutki wakacji (w każdym znaczeniu tego słowa) są czasami kolczaste; Na podstawie danych środowiskowych możesz czasem poradzić sobie z niektórymi terminami Fouriera (sinusoidalnymi) i nie musisz uciekać się do manekinów.
Nick Cox
2
Dzięki, @Nick Cox. Terminy Fouriera nie wydają się rozwiązaniem w moim szczególnym przypadku, w którym zmienne wykazują bardziej skomplikowany wzór sezonowy niż sygnały sinusoidalne (chyba że użyję kilku harmonicznych, ale nie jest to tak bardzo celem). I mimo że sezonowość nie jest w moim przypadku mało interesującym terminem, bardziej szukałem czegoś, co pomogłoby mi wyjaśnić dodatkową zmienność danych poza sezonowością (tj. Trend długoterminowy) w funkcji innych zmiennych.
ztl
4
Co z wielowymiarowym modelem ARMA? Jest podobny do VAR, ale jeśli dobrze rozumiem, pozwala na bardziej dynamiczną interakcję między zmiennymi. Ktoś inny może potwierdzić / odrzucić moje podejrzenie.
rbatt

Odpowiedzi:

1

Wiem, że to pytanie jest dość stare, ale pozostało bez odpowiedzi. Być może głównym pytaniem nie jest to, jak usunąć cykl sezonowy w danych, ale jest to jego część, więc spróbuję: Aby usunąć sezonowość z zestawu danych, istnieje kilka metod, od prostych średnich miesięcznych do dopasowanie funkcji sinusoidalnej (lub innej odpowiedniej harmonicznej) za pomocą nieliniowych metod dopasowania, takich jak Nelder-Mead.

Najłatwiejszym sposobem jest uśrednienie danych należących do wszystkich Styczników, do wszystkich Luty i tak dalej, tj. Tworzysz złożony cykl roczny, który następnie możesz odjąć od swoich danych

nukimov
źródło