W jakich okolicznościach odpowiedni jest proces magistra lub proces AR?

21

Rozumiem, że jeśli proces zależy od jego poprzednich wartości, to jest to proces AR. Jeśli zależy to od poprzednich błędów, jest to proces MA.

Kiedy wystąpi jedna z tych dwóch sytuacji? Czy ktoś ma solidny przykład, który uwidacznia zasadniczą kwestię dotyczącą tego, co oznacza najlepiej modelować proces jako MA vs AR?

Matt O'Brien
źródło
3
To nie jest tak prosta dychotomia jak to; w końcu AR może być zapisane jako nieskończone MA, a (odwracalne) MA może być zapisane jako nieskończone AR, więc jeśli którykolwiek z nich jest odpowiedni, prawdopodobnie tak samo jest z drugim.
Glen_b
1
Glen_b, możesz to rozwinąć? Rozumiem, że to nie jest prosta dychotomia ... czy słusznie mogę założyć (nawet nadzieję), że jest tu coś, co warto odkryć? Nie chcę po prostu uruchamiać acf / pacf i udawać, że dobrze rozumiem ten proces.
Matt O'Brien
Bardzo powiązane: rzeczywiste przykłady procesów średniej ruchomej
S. Kolassa - Przywrócenie Moniki

Odpowiedzi:

10

Jednym ważnym i użytecznym rezultatem jest twierdzenie reprezentacji Wolda (czasami nazywane rozkładem Wolda), które mówi, że każda kowariancyjno-stacjonarna seria czasowa Yt może być zapisana jako suma dwóch serii czasowych, jednej deterministycznej i jednej stochastycznej.

Yt=μt+jot=0bjotεt-jot, gdzie μt jest deterministyczne.

Drugi termin to nieskończony MA.

(Jest tak również w przypadku, gdy odwracalne MA można zapisać jako nieskończony proces AR).

Sugeruje to, że jeśli szereg jest kowariancyjno-stacjonarny i jeśli założymy, że możesz zidentyfikować część deterministyczną, to zawsze możesz napisać część stochastyczną jako proces MA. Podobnie, jeśli IZ spełnia warunek odwracalności, zawsze można zapisać go jako proces AR.

Jeśli masz proces napisany w jednym formularzu, często możesz go przekonwertować na inny formularz.

Przynajmniej w jednym sensie, w przypadku stacjonarnych szeregów kowariancji, często odpowiednie będzie AR lub MA.

Oczywiście w praktyce wolelibyśmy nie mieć bardzo dużych modeli. Jeśli masz skończone AR lub MA, zarówno ACF, jak i PACF ostatecznie rozpadają się geometrycznie (istnieje funkcja geometryczna, której bezwzględna wartość którejkolwiek z funkcji będzie znajdować się poniżej), co zwykle będzie oznaczać, że dobre przybliżenie AR lub MA w innej formie może często być dość krótkie.

Zatem w warunkach kowariancji stacjonarnych i przy założeniu, że możemy zidentyfikować deterministyczne i stochastyczne składniki, często zarówno AR, jak i MA mogą być odpowiednie.

Metodologia Boxa i Jenkinsa szuka modelu oszczędnego - modelu AR, MA lub ARMA z kilkoma parametrami. Zazwyczaj ACF i PACF są używane do próby identyfikacji modelu, poprzez przekształcenie do stacjonarności (być może poprzez różnicowanie), identyfikację modelu na podstawie wyglądu ACF i PACF (czasami ludzie używają innych narzędzi), dopasowanie modelu, a następnie zbadanie struktura reszt (zwykle za pomocą ACF i PACF na resztkach), dopóki szereg resztek nie wydaje się w miarę zgodny z białym szumem. Często występuje wiele modeli, które mogą zapewnić rozsądne przybliżenie serii. (W praktyce często brane są pod uwagę inne kryteria.)

Istnieją pewne podstawy do krytyki tego podejścia. W jednym przykładzie wartości p wynikające z takiego iteracyjnego procesu zasadniczo nie uwzględniają sposobu, w jaki uzyskano model (patrząc na dane); tego problemu można przynajmniej częściowo uniknąć na przykład poprzez podział próbek. Drugą przykładową krytyką jest trudność w uzyskaniu szeregu stacjonarnego - podczas gdy w wielu przypadkach można przekształcić, aby uzyskać szereg, który wydaje się być dość spójny ze stacjonarnością, zwykle tak się nie dzieje (podobne problemy są częste problem z modelami statystycznymi, choć być może może to być bardziej problem).

[Związek między AR a odpowiadającym mu nieskończonym MA omówiono w Prognozach Hyndmana i Athanasopoulosa : zasady i praktyka , tutaj ]

Glen_b - Przywróć Monikę
źródło
1
-1, ponieważ chociaż jest to dość interesujące, tak naprawdę nie odpowiada duchowi pytania.
Jake Westfall
Cześć Jake - dziękuję za dodanie komentarza o tym, co uważasz za błędne w odpowiedzi. Jest to o wiele bardziej pomocne niż samo zdanie negatywne. Zgadzam się, że czegoś tu brakuje - przynajmniej należy wyjaśnić, dlaczego uważam, że jest to wystarczająco istotne, aby opublikować jako odpowiedź.
Glen_b
1
@ jake Wprowadziłem kilka zmian, które, mam nadzieję, wyjaśniają związek z pytaniem.
Jeszcze
Dzięki za zmiany. Usunąłem moją opinię. Moje podsumowanie skorygowanej odpowiedzi w jednym zdaniu byłoby podobne: „Trudno jest odpowiedzieć na ogólne pytanie, ponieważ w wielu przypadkach model AR lub MA może pasować do danych tak samo dobrze jak inne. „ Która jest uzasadnioną, choć rozczarowującą, odpowiedzią na pytanie.
Jake Westfall
@Jake nie odczuwa potrzeby usuwania negatywnej opinii, jeśli nadal masz zastrzeżenia; Doceniam szansę na poprawienie odpowiedzi w obu przypadkach.
Glen_b
5

Mogę udzielić przekonującej odpowiedzi na pierwszą część pytania („skąd MA?”), Ale obecnie zastanawiam się nad równie przekonującą odpowiedzią na drugą część pytania („skąd AR?”).

Rozważ szereg składający się z ceny zamknięcia (skorygowanej o podziały i dywidendy) akcji w kolejnych dniach. Cena zamknięcia na każdy dzień jest ustalana na podstawie trendu (np. Liniowego w czasie) oraz ważonych efektów dziennych szoków z poprzednich dni. Przypuszczalnie wpływ szoku w dniu t-1 będzie miał większy wpływ na cenę w dniu t niż szok w dniu t-2 itd. Zatem logicznie cena zamknięcia akcji w dniu t będzie odzwierciedlać trend wartość w dniu t plus stała (mniejsza niż 1) razy ważona suma szoków w ciągu dnia t-1 (tj. składnik błędu w dniu t-1) (MA1), ewentualnie plus stała (mniejsza niż 1) pomnożona przez sumę ważonych wyładowań w ciągu dnia t-2 (tj. wartość błędu w dniu t-2) (MA2), ..., plus nowy szok w dniu t (biały szum). Ten rodzaj modelu wydaje się odpowiedni do modelowania serii takich jak giełda, gdzie termin błędu w dniu t reprezentuje ważoną sumę wcześniejszych i bieżących szoków oraz definiuje proces MA. Pracuję nad równie przekonującym uzasadnieniem procesu opartego wyłącznie na AR.

Student
źródło
3
+1. To jedyna jak dotąd odpowiedź, która nawet próbuje odpowiedzieć na pierwotne pytanie.
S. Kolassa - Przywróć Monikę
Jeśli dobrze to rozumiem, wygląda na to, że proces AR jest lepszy do korygowania powtarzających się trendów, ale MA jest lepszy do korygowania dużych, jednorazowych wstrząsów.
Mike Campbell
0

To najprostszy przykład, który mógłbym wymyślić, aby pomóc w wizualizacji procesów AR, MA i ARMA.

Pamiętaj, że jest to tylko wizualna pomoc do wprowadzenia w temat i nie jest wystarczająco rygorystyczna, aby uwzględnić wszystkie możliwe przypadki.

Załóżmy, że: W konkursie mamy dwóch agentów, których zadaniem jest wykonanie pewnego rodzaju akcji (przeskocz poziomo w prawo).

  1. Oczekuje się, że „człowiek” średnio pokona dystans „μ” ze standardowym odchyleniem „𝛿” przy każdym skoku, zgodnie z jego możliwościami fizycznymi. Jednak człowiekowi szczególnie brakuje hartu umysłowego :), a jego wyniki zależą również od tego, czy poprzedni skok był opóźniony / spełniony / przekroczył jego oczekiwania.

  2. „Maszyna” została zaprojektowana zgodnie z dokładnie tymi samymi specyfikacjami co powyższy człowiek, z jedną tylko różnicą - maszyna jest pozbawiona emocji i nie ma na nią wpływu wcześniejsze występy.

Istnieją również dwie gry, w które obaj agenci mogą grać, przy czym każda gra wymaga dwóch skoków:

  1. „Skok końcowy” punktowany na podstawie odległości przebytej w skoku końcowym po skoku rozgrzewkowym, którego wynik jest ignorowany w zawodach, ale jest dostępny do obserwacji przez człowieka. Ostatni skok rozpoczyna się w miejscu, w którym rozpoczyna się skok rozgrzewkowy.

  2. „Skok łączony” punktowany na podstawie łącznej odległości przebytej w skokach początkowym i końcowym. Ostatni skok rozpoczyna się tam, gdzie ląduje skok początkowy.

Poniższa tabela pokazuje, który model najlepiej opisuje każdy z czterech scenariuszy związanych z powyższymi aktorami i grami.

Schemat opisujący różnice między procesami AR, MA i ARMA

CodeWarrior
źródło
Ten plakat wymaga wyjaśnienia i kontekstu, aby był zrozumiały. Czy możesz podać to w swojej odpowiedzi?
whuber
-1

Masz więc jednowymiarowy szereg czasowy i chcesz go modelować / prognozować, prawda? Wybrano użycie modelu typu ARIMA.

Parametry zależą od tego, co jest najlepsze dla zestawu danych. Ale jak się dowiesz? Najnowsze podejście to „Automatyczne prognozowanie szeregów czasowych” Hyndman & Khandakar (2008) ( pdf ).

Algorytm próbuje różnych wersji p, q, P i Q i wybiera tę z najmniejszym AIC, AICc lub BIC. Jest zaimplementowany w funkcji auto.arima () pakietu prognozy R. . Wybór kryterium informacji zależy od parametrów, które przekazujesz do funkcji.

W przypadku modelu liniowego wybór modelu z najmniejszym AIC może być równoważny z weryfikacją krzyżową z pominięciem jednego z nich.

Powinieneś również upewnić się, że masz wystarczającą ilość danych, co najmniej cztery lata.

Niektóre ważne kontrole:

  1. Czy model ma sens? Na przykład, jeśli masz miesięczną sprzedaż detaliczną, prawdopodobnie będziesz oczekiwać, że model sezonowy będzie odpowiedni.
  2. Jak dobrze prognozuje poza próbą?

Bezpośrednia odpowiedź na komentarz Firebug poniżej: Gdy Twoje dane to obsługują.

moc
źródło
3
Ta odpowiedź w ogóle nie odpowiada na pytanie:"My question is, when would one of either of these two situations occur? "
Firebug
1
„Jawna odpowiedź na komentarz Firebug poniżej: kiedy Twoje dane go obsługują”. Zgadzam się z @Firebug - to nie jest odpowiedź na pytanie i zdecydowanie nie jest to dobry przykład na rozróżnienie między tymi dwoma ...
Thomas