Interpretacja modelu ARIMA

19

Mam pytanie dotyczące modeli ARIMA. Powiedzmy, że mam szereg czasowy , który chciałbym przewidzieć, a model wydaje się dobrym sposobem na przeprowadzenie prognozy. Teraz opóźnione oznacza, że ​​na moją serię mają wpływ wcześniejsze wydarzenia. To ma sens. Ale jaka jest interpretacja błędów? Moja wcześniejsza pozostała część (jak się nie liczyłem) ma dziś wpływ na wartość mojej serii? Jak obliczane są opóźnione reszty w tej regresji, ponieważ jest to iloczyn / reszta regresji? ARIMA ( 2 , 2 ) Δ Y t = α 1 Δ Y t - 1 + α 2 Δ Y t - 2 + ν t + θ 1 ν t - 1 + θ 2 ν t - 2 YYtARIMA(2,2)

ΔYt=α1ΔYt1+α2ΔYt2+νt+θ1νt1+θ2νt2
Y
Gabriel
źródło
4
Myślę, że należy pamiętać, że modele ARIMA są modelami ateoretycznymi , więc zwykłe zasady interpretowania szacowanych współczynników regresji nie mają ścisłego zastosowania w ten sam sposób. Modele ARIMA mają pewne funkcje, o których należy pamiętać. Na przykład, im niższe wartości w AR (1), tym szybsze jest tempo konwergencji. Weźmy na przykład model AR (2). Nie wszystkie modele AR (2) są takie same! Na przykład, jeśli warunek jest spełniony, wówczas AR (2) wyświetla zachowanie pseudookresowe, w wyniku czego jego prognozy są cyklami stochastycznymi. ( α 2 1 + 4 α 2 < 0 )α1(α12)+4α2)<0)
Graeme Walsh
3
(cd ...) W nieco podobny sposób, mając do czynienia z autoregresjami wektorowymi, raczej interpretuje się funkcje odpowiedzi impulsowej (IRF) niż szacowane współczynniki; współczynniki są często zbyt trudne do zinterpretowania, ale zwykle można nadać sens IRF. Czy z ciekawości znalazłeś wiele prac, w których autor (autorzy) poświęcili wiele uwagi interpretacji współczynników w modelu ARIMA?
Graeme Walsh
2
Wygląda na to, że występuje problem z notacją. „ ” nie może mieć racji, ponieważ modele ARIMA mają trzy terminy dla każdego z elementów AR / I / MA, podczas gdy modele ARMA mają dwa (np. ) - ale wydaje się, że masz pierwsze rozróżnienie, co sugerowałoby, że masz na myśli . Edytuj, aby odzwierciedlić swoje zamiary. ( p , d , q ) ARMA ( 2 , 2 ) ARIMA ( 2 , 1 , 2 )ARIMA(2),2))(p,re,q)ARMA(2),2))ARIMA(2),1,2))
Glen_b
2
@Glen_b Pamiętam, że zadawałem to samo w innym pytaniu . Okazuje się, że mamy swego rodzaju duplikację. Obecne pytanie i pytanie z nim związane są bardzo podobne.
Graeme Walsh,

Odpowiedzi:

36

Myślę, że trzeba pamiętać, że modele ARIMA są modelami ateoretycznymi , więc zwykłe podejście do interpretacji szacowanych współczynników regresji tak naprawdę nie przenosi się na modelowanie ARIMA.

Aby zinterpretować (lub zrozumieć) oszacowane modele ARIMA, dobrze byłoby być świadomym różnych cech wyświetlanych przez wiele popularnych modeli ARIMA.

Możemy zbadać niektóre z tych funkcji, badając rodzaje prognoz generowanych przez różne modele ARIMA. Jest to główne podejście, które podjąłem poniżej, ale dobrą alternatywą byłoby przyjrzenie się funkcjom odpowiedzi impulsowej lub dynamicznym ścieżkom czasowym związanym z różnymi modelami ARIMA (lub równaniami różnic stochastycznych). Porozmawiam o tym na końcu.

Modele AR (1)

Rozważmy przez chwilę model AR (1). W tym modelu możemy powiedzieć, że im niższa wartość tym szybsze jest tempo konwergencji (do średniej). Możemy spróbować zrozumieć ten aspekt modeli AR (1), badając naturę prognoz dla małego zestawu symulowanych modeli AR (1) o różnych wartościach dla . α 1α1α1

Zestaw czterech modeli AR (1), które omówimy, można zapisać w notacji algebraicznej jako: gdzie jest stałą, a reszta notacji wynika z OP. Jak widać, każdy model różni się tylko wartością .C α 1

Yt=do+0,95Yt-1+νt                               (1)Yt=do+0,8Yt-1+νt                                (2))Yt=do+0,5Yt-1+νt                                (3))Yt=do+0,4Yt-1+νt                                (4)
doα1

Na poniższym wykresie przedstawiłem prognozy poza próbą dla tych czterech modeli AR (1). Można zauważyć, że prognozy dla modelu AR (1) z zbiegają się wolniej w porównaniu z innymi modelami. Prognozy dla modelu AR (1) z zbiegają się szybciej niż inne.α 1 = 0,4α1=0,95α1=0,4

wprowadź opis zdjęcia tutaj

Uwaga: gdy czerwona linia jest pozioma, osiągnęła średnią z symulowanej serii.

Modele MA (1)

Rozważmy teraz cztery modele MA (1) o różnych wartościach dla . Cztery omówione modele można zapisać jako: Y t = C + 0,95 ν t - 1 + ν t ( 5 )θ1

Yt=do+0,95νt-1+νt                               (5)Yt=do+0,8νt-1+νt                                (6)Yt=do+0,5νt-1+νt                                (7)Yt=do+0,4νt-1+νt                                (8)

Na poniższym wykresie nakreśliłem prognozy poza próbą dla tych czterech różnych modeli MA (1). Jak pokazuje wykres, zachowanie prognoz we wszystkich czterech przypadkach jest wyraźnie podobne; szybka (liniowa) konwergencja do średniej. Zauważ, że dynamika tych prognoz jest mniejsza w porównaniu z modelami AR (1).

wprowadź opis zdjęcia tutaj

Uwaga: gdy czerwona linia jest pozioma, osiągnęła średnią z symulowanej serii.

Modele AR (2)

Sprawy stają się o wiele bardziej interesujące, gdy zaczynamy rozważać bardziej złożone modele ARIMA. Weźmy na przykład modele AR (2). To tylko mały krok w górę od modelu AR (1), prawda? Cóż, można by tak myśleć, ale dynamika modeli AR (2) jest dość bogata, jak zobaczymy za chwilę.

Przeanalizujmy cztery różne modele AR (2):

Yt=do+1.7Yt-1-0,8Yt-2)+νt                               (9)Yt=do+0,9Yt-1-0.2Yt-2)+νt                                (10)Yt=do+0,5Yt-1-0.2Yt-2)+νt                                (11)Yt=do+0,1Yt-1-0,7Yt-2)+νt                                (12)

Prognozy poza próbą związane z każdym z tych modeli pokazano na poniższym wykresie. Oczywiste jest, że każdy z nich znacznie się różni i są one również dość zróżnicowane w porównaniu z prognozami, które widzieliśmy powyżej - z wyjątkiem prognoz modelu 2 (wykres w prawym górnym rogu), które zachowują się podobnie do prognoz dla AR (1) Model.

wprowadź opis zdjęcia tutaj

Uwaga: gdy czerwona linia jest pozioma, osiągnęła średnią z symulowanej serii.

Kluczową kwestią jest to, że nie wszystkie modele AR (2) mają tę samą dynamikę! Na przykład, jeśli warunek, jest spełniony, wówczas model AR (2) wyświetla zachowanie pseudo okresowe oraz w rezultacie jego prognozy pojawią się jako cykle stochastyczne. Z drugiej strony, jeśli warunek ten nie zostanie spełniony, cykle stochastyczne nie będą obecne w prognozach; zamiast tego prognozy będą bardziej podobne do prognoz dla modelu AR (1).

α12)+4α2)<0,

Warto zauważyć, że powyższy warunek wynika z ogólnego rozwiązania jednorodnej postaci liniowego, autonomicznego równania różniczkowego drugiego rzędu (ze złożonymi pierwiastkami). Jeśli jest to obce, polecam zarówno rozdział 1 Hamiltona (1994), jak i rozdział 20 Hoy i in. (2001).

Testowanie powyższego warunku dla czterech modeli AR (2) daje następujące wyniki:

(1.7)2)+4(-0,8)=-0,31<0                               (13)(0,9)2)+4(-0.2)=0,01>0                                 (14)(0,5)2)+4(-0.2)=-0,55<0                               (15)(0,1)2)+4(-0,7)=-2,54<0                               (16)

Jak można się spodziewać po pojawieniu się wykreślonych prognoz, warunek jest spełniony dla każdego z czterech modeli oprócz modelu 2. Przypomnijmy z wykresu, że prognozy modelu 2 zachowują się („normalnie”) podobnie jak prognozy modelu AR (1). Prognozy powiązane z innymi modelami zawierają cykle.

Aplikacja - modelowanie inflacji

Teraz, gdy mamy już pewne podstawy, spróbujmy zinterpretować model AR (2) w aplikacji. Rozważ następujący model stopy inflacji ( ): Naturalnym wyrażeniem skojarzenia z takim modelem byłoby coś w stylu: „inflacja dzisiaj zależy od poziomu inflacji wczoraj i od poziomu inflacji dzień wcześniej”πt

πt=do+α1πt-1+α2)πt-2)+νt.
. Nie sprzeciwiłbym się takiej interpretacji, ale sugerowałbym, aby zachować ostrożność i abyśmy pogłębili się, aby opracować właściwą interpretację. W takim przypadku możemy zapytać, w jaki sposób inflacja jest powiązana z poprzednimi poziomami inflacji? Czy są cykle? Jeśli tak, ile jest cykli? Czy możemy powiedzieć coś o szczycie i dołku? Jak szybko prognozy zbiegają się ze średnią? I tak dalej.

To są pytania, które możemy zadać, próbując zinterpretować model AR (2) i jak widać, nie jest to tak proste, jak przyjęcie oszacowanego współczynnika i powiedzenie: „wzrost o 1 jednostkę w tej zmiennej jest związany z tak- wzrost o wiele jednostek zmiennej zależnej ” - oczywiście dołączając warunek ceteris paribus do tego stwierdzenia.

Pamiętaj, że w dotychczasowej dyskusji badaliśmy tylko wybrane modele AR (1), MA (1) i AR (2). Nawet nie przyjrzeliśmy się dynamice mieszanych modeli ARMA i modeli ARIMA obejmujących większe opóźnienia.

Aby pokazać, jak trudno byłoby interpretować modele należące do tej kategorii, wyobraź sobie inny model inflacji - ARMA (3,1) z ograniczonym do zera: α2)

πt=do+α1πt-1+α3)πt-3)+θ1νt-1+νt.

Powiedz, co chcesz, ale tutaj lepiej spróbować zrozumieć dynamikę samego systemu. Tak jak poprzednio, możemy spojrzeć i zobaczyć, jakie prognozy wytwarza model, ale alternatywnym podejściem, o którym wspomniałem na początku tej odpowiedzi, było przyjrzenie się funkcji odpowiedzi impulsowej lub ścieżce czasowej związanej z systemem.

To prowadzi mnie do następnej części mojej odpowiedzi, gdzie omówimy funkcje odpowiedzi impulsowej.

Funkcje odpowiedzi impulsowej

Ci, którzy są zaznajomieni z automatycznymi regresjami wektorowymi (VAR), będą świadomi, że zwykle próbuje się zrozumieć oszacowany model VAR, interpretując funkcje odpowiedzi impulsowej; zamiast próbować interpretować oszacowane współczynniki, które i tak często są zbyt trudne do interpretacji.

To samo podejście można zastosować, próbując zrozumieć modele ARIMA. To znaczy, zamiast próbować zrozumieć (skomplikowane) stwierdzenia, takie jak: „dzisiejsza inflacja zależy od inflacji z wczoraj i od inflacji sprzed dwóch miesięcy, ale nie od inflacji z zeszłego tygodnia!” zamiast tego wykreślamy funkcję odpowiedzi impulsowej i staramy się to zrozumieć.

Zastosowanie - cztery zmienne makro

W tym przykładzie (na podstawie Leamera (2010)) rozważmy cztery modele ARIMA oparte na czterech zmiennych makroekonomicznych; Wzrost PKB, inflacja, stopa bezrobocia i krótkoterminowa stopa procentowa. Cztery modele zostały oszacowane i można je zapisać jako: gdzie oznacza wzrost PKB w czasie , oznacza inflację, oznacza stopę bezrobocia, i

Yt=3,20+0,22Yt-1+0,15Yt-2)+νtπt=4.10+0,46πt-1+0,31πt-2)+0,16πt-3)+0,01πt-4+νtut=6.2+1,58ut-1-0,64ut-2)+νtrt=6.0+1.18rt-1-0,23rt-2)+νt
Yttπur oznacza krótkoterminową stopę procentową (3-miesięczny skarbiec).

Równania pokazują, że wzrost PKB, stopa bezrobocia i krótkoterminowa stopa procentowa są modelowane jako procesy AR (2), podczas gdy inflacja jest modelowana jako proces AR (4).

Zamiast próbować interpretować współczynniki w każdym równaniu, wykreślmy funkcje odpowiedzi impulsowej (IRF) i je zinterpretujmy. Poniższy wykres pokazuje funkcje odpowiedzi impulsowej związane z każdym z tych modeli.

wprowadź opis zdjęcia tutaj

Nie traktuj tego jako klasy mistrzowskiej w interpretacji IRF - myśl o tym bardziej jak o podstawowym wprowadzeniu - ale tak czy inaczej, aby pomóc nam interpretować IRF, musimy przyzwyczaić się do dwóch pojęć; pęd i wytrwałość .

Te dwie koncepcje zostały zdefiniowane w Leamer (2010) w następujący sposób:

Momentum : Momentum to tendencja do kontynuowania ruchu w tym samym kierunku. Efekt pędu może zrównoważyć siłę regresji (zbieżności) w kierunku średniej i może pozwolić zmiennej na odejście od średniej historycznej na pewien czas, ale nie na czas nieokreślony.

Trwałość : Zmienna trwałości będzie się zawieszać w miejscu, w którym się znajduje, i będzie powoli zbliżać się do średniej historycznej.

Wyposażeni w tę wiedzę, zadajemy teraz pytanie: załóżmy, że zmienna osiąga wartość historyczną i otrzymuje tymczasowy szok jednostkowy w jednym okresie, jak zmienna zareaguje w przyszłych okresach? Jest to podobne do zadawania pytań, które zadaliśmy wcześniej, takich jak: czy prognozy zawierają cykle? , jak szybko prognozy zbliżają się do średniej? itd.

W końcu możemy teraz spróbować zinterpretować IRF.

Po szoku jednostkowym stopa bezrobocia i krótkoterminowe oprocentowanie (3-miesięczny skarbiec) są odejmowane od średniej historycznej. To jest efekt rozpędu. IRF pokazują również, że stopa bezrobocia jest wyższa niż krótkoterminowa stopa procentowa.

Widzimy również, że wszystkie zmienne wracają do swoich historycznych środków (żadna z nich nie „wysadza” w powietrze), chociaż każda z nich robi to w różnym tempie. Na przykład wzrost PKB wraca do historycznej średniej po około 6 okresach po szoku, stopa bezrobocia wraca do swojej historycznej średniej po około 18 okresach, ale inflacja i krótkoterminowe odsetki powracają do swoich historycznych średnich. W tym sensie wzrost PKB jest najmniej trwałym z czterech zmiennych, podczas gdy można powiedzieć, że inflacja jest bardzo trwała.

Myślę, że słusznym wnioskiem jest stwierdzenie, że (przynajmniej częściowo) udało nam się zrozumieć, co cztery modele ARIMA mówią nam o każdej z czterech makrozmiennych.

Wniosek

Zamiast interpretować oszacowane współczynniki w modelach ARIMA (trudne dla wielu modeli), spróbuj zamiast tego zrozumieć dynamikę systemu. Możemy tego spróbować, badając prognozy tworzone przez nasz model i wykreślając funkcję odpowiedzi impulsowej.

[Jestem szczęśliwy, że mogę udostępnić mój kod R, jeśli ktoś tego chce.]

Bibliografia

  • Hamilton, JD (1994). Analiza szeregów czasowych (Vol. 2). Princeton: prasa uniwersytecka Princeton.
  • Leamer, E. (2010). Wzorce i historie makroekonomiczne - Przewodnik dla MBA, Springer.
  • Stengos, T., M. Hoy, J. Livernois, C. McKenna i R. Rees (2001). Mathematics for Economics, 2. wydanie, MIT Press: Cambridge, MA.
Graeme Walsh
źródło
3
Uwielbiam stosowanie IRF do nie-VAR. Zawsze wydają się być powiązane i nigdy nie myślałem o użyciu IRF-ów na zwykłych ARIMA. (To plus, kto naprawdę może zrozumieć, co robią warunki MA?)
Wayne
2
Co za świetna odpowiedź!
Richard Hardy,
9

Zauważ, że ze względu na twierdzenie Wolda o dekompozycji możesz przepisać dowolny stacjonarny model ARMA jako model , tj .:M.ZA()

ΔYt=jot=0ψjotνt-jot

W tej formie nie ma zmiennych opóźnionych, więc każda interpretacja obejmująca pojęcie zmiennej opóźnionej nie jest zbyt przekonująca. Patrząc jednak oddzielnie na modele i :M.ZA(1)ZAR(1)

Yt=νt+θ1νt-1

Yt=ρYt-1+νt=νt+ρνt-1+ρ2)νt-1+...

można powiedzieć, że terminy błędów w modelach ARMA wyjaśniają wpływ „krótkoterminowy” przeszłości, a terminy opóźnione wyjaśniają wpływ „długoterminowy”. Powiedziawszy, że nie sądzę, że to bardzo pomaga i zwykle nikt nie zawraca sobie głowy precyzyjną interpretacją współczynników ARMA. Zazwyczaj celem jest uzyskanie odpowiedniego modelu i wykorzystanie go do prognozowania.

mpiktas
źródło
+1 To jest mniej więcej to, co próbowałem uzyskać w moich komentarzach powyżej.
Graeme Walsh
Ha, nie widziałem waszych komentarzy, kiedy pisałem odpowiedź. Proponuję przekonwertować je na odpowiedź.
mpiktas
8

Całkowicie zgadzam się z sentymentem poprzednich komentatorów. Chciałbym dodać, że cały model ARIMA może być również reprezentowany jako czysty model AR. Wagi te są nazywane wagami Pi w porównaniu z czystą formą MA (wagi Psi). W ten sposób można wyświetlić (zinterpretować) model ARIMA jako zoptymalizowaną średnią ważoną poprzednich wartości. Innymi słowy, zamiast zakładać z góry określoną długość i wartości średniej ważonej, model ARIMA podaje zarówno długość ( ) wag, jak i rzeczywiste wagi ( ).ndo1,do2),...,don

Y(t)=do1Y(t-1)+do2)Y(t-2))+do3)Y(t-3))+...+donY(t-n)+za(t)

W ten sposób model ARIMA można wyjaśnić jako odpowiedź na pytanie

  1. Ile wartości historycznych powinienem zastosować, aby obliczyć ważoną sumę przeszłości?
  2. Jakie dokładnie są te wartości?
IrishStat
źródło