Rozumiem, że jeśli proces zależy od jego poprzednich wartości, to jest to proces AR. Jeśli zależy to od poprzednich błędów, jest to proces MA.
Kiedy wystąpi jedna z tych dwóch sytuacji? Czy ktoś ma solidny przykład, który uwidacznia zasadniczą kwestię dotyczącą tego, co oznacza najlepiej modelować proces jako MA vs AR?
time-series
autoregressive
moving-average
Matt O'Brien
źródło
źródło
Odpowiedzi:
Jednym ważnym i użytecznym rezultatem jest twierdzenie reprezentacji Wolda (czasami nazywane rozkładem Wolda), które mówi, że każda kowariancyjno-stacjonarna seria czasowaYt może być zapisana jako suma dwóch serii czasowych, jednej deterministycznej i jednej stochastycznej.
Drugi termin to nieskończony MA.
(Jest tak również w przypadku, gdy odwracalne MA można zapisać jako nieskończony proces AR).
Sugeruje to, że jeśli szereg jest kowariancyjno-stacjonarny i jeśli założymy, że możesz zidentyfikować część deterministyczną, to zawsze możesz napisać część stochastyczną jako proces MA. Podobnie, jeśli IZ spełnia warunek odwracalności, zawsze można zapisać go jako proces AR.
Jeśli masz proces napisany w jednym formularzu, często możesz go przekonwertować na inny formularz.
Przynajmniej w jednym sensie, w przypadku stacjonarnych szeregów kowariancji, często odpowiednie będzie AR lub MA.
Oczywiście w praktyce wolelibyśmy nie mieć bardzo dużych modeli. Jeśli masz skończone AR lub MA, zarówno ACF, jak i PACF ostatecznie rozpadają się geometrycznie (istnieje funkcja geometryczna, której bezwzględna wartość którejkolwiek z funkcji będzie znajdować się poniżej), co zwykle będzie oznaczać, że dobre przybliżenie AR lub MA w innej formie może często być dość krótkie.
Zatem w warunkach kowariancji stacjonarnych i przy założeniu, że możemy zidentyfikować deterministyczne i stochastyczne składniki, często zarówno AR, jak i MA mogą być odpowiednie.
Metodologia Boxa i Jenkinsa szuka modelu oszczędnego - modelu AR, MA lub ARMA z kilkoma parametrami. Zazwyczaj ACF i PACF są używane do próby identyfikacji modelu, poprzez przekształcenie do stacjonarności (być może poprzez różnicowanie), identyfikację modelu na podstawie wyglądu ACF i PACF (czasami ludzie używają innych narzędzi), dopasowanie modelu, a następnie zbadanie struktura reszt (zwykle za pomocą ACF i PACF na resztkach), dopóki szereg resztek nie wydaje się w miarę zgodny z białym szumem. Często występuje wiele modeli, które mogą zapewnić rozsądne przybliżenie serii. (W praktyce często brane są pod uwagę inne kryteria.)
Istnieją pewne podstawy do krytyki tego podejścia. W jednym przykładzie wartości p wynikające z takiego iteracyjnego procesu zasadniczo nie uwzględniają sposobu, w jaki uzyskano model (patrząc na dane); tego problemu można przynajmniej częściowo uniknąć na przykład poprzez podział próbek. Drugą przykładową krytyką jest trudność w uzyskaniu szeregu stacjonarnego - podczas gdy w wielu przypadkach można przekształcić, aby uzyskać szereg, który wydaje się być dość spójny ze stacjonarnością, zwykle tak się nie dzieje (podobne problemy są częste problem z modelami statystycznymi, choć być może może to być bardziej problem).
[Związek między AR a odpowiadającym mu nieskończonym MA omówiono w Prognozach Hyndmana i Athanasopoulosa : zasady i praktyka , tutaj ]
źródło
Mogę udzielić przekonującej odpowiedzi na pierwszą część pytania („skąd MA?”), Ale obecnie zastanawiam się nad równie przekonującą odpowiedzią na drugą część pytania („skąd AR?”).
Rozważ szereg składający się z ceny zamknięcia (skorygowanej o podziały i dywidendy) akcji w kolejnych dniach. Cena zamknięcia na każdy dzień jest ustalana na podstawie trendu (np. Liniowego w czasie) oraz ważonych efektów dziennych szoków z poprzednich dni. Przypuszczalnie wpływ szoku w dniu t-1 będzie miał większy wpływ na cenę w dniu t niż szok w dniu t-2 itd. Zatem logicznie cena zamknięcia akcji w dniu t będzie odzwierciedlać trend wartość w dniu t plus stała (mniejsza niż 1) razy ważona suma szoków w ciągu dnia t-1 (tj. składnik błędu w dniu t-1) (MA1), ewentualnie plus stała (mniejsza niż 1) pomnożona przez sumę ważonych wyładowań w ciągu dnia t-2 (tj. wartość błędu w dniu t-2) (MA2), ..., plus nowy szok w dniu t (biały szum). Ten rodzaj modelu wydaje się odpowiedni do modelowania serii takich jak giełda, gdzie termin błędu w dniu t reprezentuje ważoną sumę wcześniejszych i bieżących szoków oraz definiuje proces MA. Pracuję nad równie przekonującym uzasadnieniem procesu opartego wyłącznie na AR.
źródło
To najprostszy przykład, który mógłbym wymyślić, aby pomóc w wizualizacji procesów AR, MA i ARMA.
Pamiętaj, że jest to tylko wizualna pomoc do wprowadzenia w temat i nie jest wystarczająco rygorystyczna, aby uwzględnić wszystkie możliwe przypadki.
Załóżmy, że: W konkursie mamy dwóch agentów, których zadaniem jest wykonanie pewnego rodzaju akcji (przeskocz poziomo w prawo).
Oczekuje się, że „człowiek” średnio pokona dystans „μ” ze standardowym odchyleniem „𝛿” przy każdym skoku, zgodnie z jego możliwościami fizycznymi. Jednak człowiekowi szczególnie brakuje hartu umysłowego :), a jego wyniki zależą również od tego, czy poprzedni skok był opóźniony / spełniony / przekroczył jego oczekiwania.
„Maszyna” została zaprojektowana zgodnie z dokładnie tymi samymi specyfikacjami co powyższy człowiek, z jedną tylko różnicą - maszyna jest pozbawiona emocji i nie ma na nią wpływu wcześniejsze występy.
Istnieją również dwie gry, w które obaj agenci mogą grać, przy czym każda gra wymaga dwóch skoków:
„Skok końcowy” punktowany na podstawie odległości przebytej w skoku końcowym po skoku rozgrzewkowym, którego wynik jest ignorowany w zawodach, ale jest dostępny do obserwacji przez człowieka. Ostatni skok rozpoczyna się w miejscu, w którym rozpoczyna się skok rozgrzewkowy.
„Skok łączony” punktowany na podstawie łącznej odległości przebytej w skokach początkowym i końcowym. Ostatni skok rozpoczyna się tam, gdzie ląduje skok początkowy.
Poniższa tabela pokazuje, który model najlepiej opisuje każdy z czterech scenariuszy związanych z powyższymi aktorami i grami.
źródło
Masz więc jednowymiarowy szereg czasowy i chcesz go modelować / prognozować, prawda? Wybrano użycie modelu typu ARIMA.
Parametry zależą od tego, co jest najlepsze dla zestawu danych. Ale jak się dowiesz? Najnowsze podejście to „Automatyczne prognozowanie szeregów czasowych” Hyndman & Khandakar (2008) ( pdf ).
Algorytm próbuje różnych wersji p, q, P i Q i wybiera tę z najmniejszym AIC, AICc lub BIC. Jest zaimplementowany w funkcji auto.arima () pakietu prognozy R. . Wybór kryterium informacji zależy od parametrów, które przekazujesz do funkcji.
W przypadku modelu liniowego wybór modelu z najmniejszym AIC może być równoważny z weryfikacją krzyżową z pominięciem jednego z nich.
Powinieneś również upewnić się, że masz wystarczającą ilość danych, co najmniej cztery lata.
Niektóre ważne kontrole:
Bezpośrednia odpowiedź na komentarz Firebug poniżej: Gdy Twoje dane to obsługują.
źródło
"My question is, when would one of either of these two situations occur? "