Analiza interwencji z wielowymiarowymi szeregami czasowymi

11

Chciałbym przeprowadzić analizę interwencyjną w celu oszacowania wyników decyzji politycznej dotyczącej sprzedaży alkoholu w czasie. Jestem jednak całkiem nowy w analizie szeregów czasowych, więc mam kilka pytań dla początkujących.

Analiza literatury ujawnia, że ​​inni badacze wykorzystali ARIMA do modelowania sprzedaży alkoholu w szeregu czasowym, przy czym zmienne zastępcze służą jako regresor do modelowania efektu interwencji. Chociaż wydaje się to rozsądnym podejściem, mój zestaw danych jest nieco bogatszy niż te, które znalazłem w literaturze. Po pierwsze, mój zestaw danych jest zdezagregowany według rodzaju napoju (tj. Piwo, wino, napoje spirytusowe), a następnie dalej zdezagregowany według strefy geograficznej.

Chociaż mógłbym utworzyć osobne analizy ARIMA dla każdej zdezagregowanej grupy, a następnie porównać wyniki, podejrzewam, że jest tutaj lepsze podejście. Czy ktoś bardziej obeznany z wielowymiarowymi danymi szeregów czasowych może dostarczyć wskazówek i sugestii?

fmark
źródło

Odpowiedzi:

9

Model ARIMA ze zmienną fikcyjną dla interwencji jest szczególnym przypadkiem modelu liniowego z błędami ARIMA.

Możesz zrobić to samo tutaj, ale z bogatszym modelem liniowym obejmującym czynniki dla rodzaju napoju i stref geograficznych.

W R model można oszacować za pomocą arima () ze zmiennymi regresji zawartymi za pomocą argumentu xreg. Niestety będziesz musiał zakodować czynniki przy użyciu zmiennych zastępczych, ale w przeciwnym razie jest to stosunkowo proste.

Rob Hyndman
źródło
6

Jeśli chcesz modelować sprzedaż rodzajów napojów jako wektor [sprzedaż wina wt, sprzedaż piwa wt, sprzedaż napojów spirytusowych t], możesz przyjrzeć się modelom Vector Autoregresji (VAR). Prawdopodobnie chcesz mieć odmianę VARX, która ma wektor zmiennych egzogenicznych, takich jak region i manekin interwencyjny, obok sekwencji wina, piwa i napojów spirytusowych. Są dość proste w dopasowaniu, a otrzymasz funkcje odpowiedzi impulsowej, aby wyrazić wpływ wstrząsów egzogennych, co może być również interesujące. W książce Lütkepohla jest obszerna dyskusja na temat wielowymiarowych szeregów czasowych.

Wreszcie, z pewnością nie jestem ekonomistą, ale wydaje mi się, że możesz również pomyśleć o stosunkach tych rodzajów napojów, a także o poziomach. Ludzie prawdopodobnie działają pod ograniczonym budżetem alkoholowym - wiem, że tak - co łączyłoby poziomy i (anty) korelowało błędy.

sprzężonyprior
źródło
3

Każda seria czasowa powinna być oceniana osobno z ostatecznym pomysłem gromadzenia, tj. Grupowanie podobnych serii w grupy lub sekcje jako mające podobną / wspólną strukturę. Ponieważ dane szeregów czasowych mogą być interweniowane przez nieznaną deterministyczną strukturę w nieokreślonych punktach czasowych, zaleca się wykonanie Wykrywania interwencji, aby dowiedzieć się, gdzie interwencja rzeczywiście miała wpływ. Jeśli wiesz, że prawo weszło w życie w określonym punkcie (de jure), może to w rzeczywistości (de facto) nie być datą, kiedy interwencja rzeczywiście miała miejsce. Systemy mogą zareagować przed znaną datą wejścia w życie lub nawet po tej dacie z powodu niezgodności lub braku odpowiedzi. Określenie daty interwencji może prowadzić do stronniczości specyfikacji modelu. Sugeruję, abyś użył Google „Wykrywanie interwencji” lub „Wykrywanie wartości odstających”. Dobrą książką na ten temat byłaby profesor Wei z Temple University wydana przez Addison-Wessley. Uważam, że tytuł to „Analiza szeregów czasowych”. Kolejny komentarz Zmienna interwencji może pojawić się jako puls lub zmiana poziomu / kroku lub puls sezonowy lub trend czasu lokalnego.

W odpowiedzi na rozszerzenie dyskusji na temat trendów czasu lokalnego:

Jeśli masz serię, która wykazuje 1,2,3,4,5,7,9,11,13,155,16,17,18,19 ... nastąpiła zmiana trendu w okresie 5 i 10 Dla mnie głównym pytaniem w szeregach czasowych jest wykrywanie przesunięć poziomów, np. 1,2,3,4,5,8,9,10, lub inny przykład przesunięcia poziomu 1,1,1,1,2 , 2,2,2, AND / OR lub wykrycie przerw trendu czasowego. Tak jak puls jest różnicą kroku, krok jest różnicą trendu. Rozszerzyliśmy teorię wykrywania interwencji do czwartego wymiaru, tj. Zmiany punktu trendu. Jeśli chodzi o otwartość, udało mi się wdrożyć takie schematy wykrywania interwencji w połączeniu z ARIMA i modelami funkcji przenoszenia. Jestem jednym ze starszych statystycznych szeregów czasowych, którzy współpracowali przy opracowywaniu AUTOBOX, który zawiera te funkcje. Nie znam nikogo, kto zaprogramował tę ekscytującą innowację.

IrishStat
źródło
Czy mógłbyś nieco bardziej szczegółowo Local Time Trendwyjaśnić, jak wygląda zmienna interwencyjna? Znam pozostałe trzy.
fmark
Czy możesz też wskazać mi pakiet R, który może być w stanie wykryć interwencję?
fmark
1
Jeśli masz serię, która wykazuje 1,2,3,4,5,7,9,11, ... nastąpiła zmiana trendu w okresie 5. Głównym pytaniem w szeregach czasowych jest wykrycie przesunięć poziomów, np. 1,2,3,4,5,8,9,10, .. lub inny przykład przesunięcia poziomu 1,1,1,1,2,2,2,2,2 i lub wykrycia zmian trendu czasowego.
IrishStat
Jak znaleźć interwencje w szeregu czasowym z zewnętrznymi regresorami? Skąd wiadomo, że regresor nie wyjaśnia interwencji?
Frank
jeśli interwencja w Y zostanie znaleziona PO uderzeniu X i jego historii w historię Y, TO zostanie ogłoszona anomalia / puls z zewnętrznymi regresorami.
IrishStat