Poszukiwanie określonego rodzaju wyjaśnień ARIMA

25

To może być trudne do znalezienia, ale chciałbym przeczytać dobrze wyjaśnione przykład ARIMA że

  • używa minimalnej matematyki

  • rozszerza dyskusję poza budowanie modelu na wykorzystanie tego modelu do prognozowania konkretnych przypadków

  • wykorzystuje grafikę, a także wyniki numeryczne, aby scharakteryzować dopasowanie wartości prognozowanych do rzeczywistych.

rolando2
źródło

Odpowiedzi:

7

Moją zasugerowaną lekturą byłoby wprowadzenie do modelowania ARIMA

Applied Time Series Analysis for the Social Sciences 1980, autor: R. McCleary; RA Hay; EE Meidinger; D McDowall

Jest to skierowane do naukowców społecznych, więc wymagania matematyczne nie są zbyt rygorystyczne. Również w przypadku krótszych zabiegów sugerowałbym dwie Sage Green Book (chociaż są one całkowicie zbędne w przypadku książki McCleary),

Tekst Ostrom jest tylko modelowaniem ARiMR i nie omawia prognozowania. Nie sądzę, aby spełniały one również twoje wymagania dotyczące graficznego błędu prognozy. Jestem pewien, że możesz znaleźć więcej przydatnych zasobów, badając pytania oznaczone szeregami czasowymi również na tym forum.

Andy W.
źródło
Książka McCleary jest wspaniale napisana, zwięzła i stanowi bardzo dobre wprowadzenie. W ostatnim rozdziale jest też trochę niezamierzonego humoru, w którym mówią o językach wysokiego poziomu, takich jak Fortran.
richiemorrisroe
31

Spróbuję odpowiedzieć na delikatne wezwanie bicza, by po prostu „odpowiedzieć na pytanie” i kontynuować temat. Otrzymujemy 144 miesięczne odczyty serii o nazwie „The Airline Series”. Box i Jenkins byli szeroko krytykowani za dostarczenie prognozy, która była bardzo zawyżona ze względu na „wybuchową naturę” odwróconej transformacji.wprowadź opis zdjęcia tutaj

Wizualnie mamy wrażenie, że wariancja oryginalnej serii wzrasta wraz z poziomem serii, co sugeruje potrzebę transformacji. Wiemy jednak, że jednym z wymagań dotyczących użytecznego modelu jest to, że wariancja „błędów modelu” musi być jednorodna. Nie są konieczne żadne założenia dotyczące wariancji oryginalnej serii. Są identyczne, jeśli model jest po prostu stałą, tj. Y (t) = u. Jak /stats//users/2392/probabilityislogic tak jasno stwierdził w swojej odpowiedzi na Poradę wyjaśniania heterogeniczności / heteroscedastyczności „jedną z rzeczy, które zawsze uważam za zabawne, jest ta„ nienormalność danych ”, że ludzie się martwią o. Dane nie muszą być normalnie dystrybuowane, ale termin błędu ”

Wczesna praca w szeregach czasowych często błędnie przeskakiwała do wniosków na temat nieuzasadnionych przekształceń. Odkryjemy tutaj, że transformacją naprawczą dla tych danych jest po prostu dodanie trzech modeli manekinów do modelu ARIMA odzwierciedlających korektę dla trzech nietypowych punktów danych. Poniżej przedstawiono wykres funkcji autokorelacji sugerujący silną autokorelację przy opóźnieniu 12 (.76) i opóźnieniu 1 (.948). Autokorelacje to po prostu współczynniki regresji w modelu, w którym y jest zmienną zależną przewidywaną przez opóźnienie y.

wprowadź opis zdjęcia tutaj! wprowadź opis zdjęcia tutaj

Powyższa analiza sugeruje, że jeden model pierwszych różnic w szeregu i bada ten „szereg resztkowy”, który jest identyczny z pierwszymi różnicami w pierwszej kolejności ze względu na swoje właściwości. wprowadź opis zdjęcia tutaj

Ta analiza potwierdza pogląd, że w danych istnieje silny wzorzec sezonowy, który można naprawić lub modelować za pomocą modelu zawierającego dwa operatory różnicujące.

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj

To proste podwójne różnicowanie daje zbiór wartości rezydualnych zwanych również serią skorygowaną lub, mówiąc luźniej, szeregiem transformowanym, co świadczy o niestałej wariancji, ale przyczyną niestałej wariancji jest nie-stała średnia reszt. podwójnie zróżnicowane serie, co sugeruje trzy anomalie na końcu serii. Autokorelacja tej serii fałszywie wskazuje, że „wszystko jest w porządku” i może zaistnieć potrzeba jakiejkolwiek korekty Ma (1). Należy zachować ostrożność, ponieważ w danych występuje sugestia anomalii, dlatego acf jest tendencyjny w dół. Nazywa się to „efektem Alicji w krainie czarów”, tzn. Przyjmuje hipotezę zerową braku widocznej struktury, gdy ta struktura jest maskowana przez naruszenie jednego z założeń.

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj

Wizualnie wykrywamy trzy niezwykłe punkty (117 135 135)

wprowadź opis zdjęcia tutaj

Ten etap wykrywania wartości odstających nazywa się Wykrywaniem Interwencji i można go łatwo lub nie tak łatwo zaprogramować po pracy Tsay.

wprowadź opis zdjęcia tutajwprowadź opis zdjęcia tutaj

Jeśli dodamy trzy wskaźniki do modelu, otrzymamy wprowadź opis zdjęcia tutaj

Następnie możemy oszacować

wprowadź opis zdjęcia tutaj

I otrzymaj wykres resztek i acf

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Ten acf sugeruje, że dodamy potencjalnie dwa współczynniki średniej ruchomej do modelu. Tak więc kolejnym oszacowanym modelem może być.

wprowadź opis zdjęcia tutaj

Wydajność

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj Następnie można usunąć nieistotną stałą i uzyskać dopracowany model: wprowadź opis zdjęcia tutaj

Zauważamy, że żadne transformacje mocy nie były potrzebne, aby uzyskać zbiór reszt o stałej wariancji. Pamiętaj, że prognozy nie są wybuchowe.

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

W kategoriach prostej ważonej sumy mamy: 13 wag; 3 niezerowe i równe (1.0.1,0., - 1,0)

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Materiał ten został zaprezentowany w sposób nieautomatyczny, co w konsekwencji wymagało interakcji użytkownika w zakresie podejmowania decyzji modelowych.

IrishStat
źródło
Cześć IrishStat, to znowu ja. Podobał mi się twój obszerny przykład, ale są dwa niejasne fragmenty (przynajmniej dla mnie): „Autokorelacja z tej serii fałszywie wskazuje, że„ wszystko jest dobrze ”i może być konieczne wprowadzenie jakiejkolwiek korekty Ma (1) ”i„ Ten plik acf sugeruje, że dodamy potencjalnie dwa współczynniki średniej ruchomej do modelu ”. Dokładnie co widzisz na tych wykresach ACF, które sprawiają, że w to wierzysz? Czy oba nie wyglądają dobrze (prawie wszystkie wartości mieszczą się w „niebieskich liniach”)?
Bruder,
: VBruder Myślę, że „pomyliłem się” ze stwierdzeniem „może istnieć .....”. W drugim przykładzie istnieją dowody na „zły acf” w opóźnieniu 1 i opóźnieniu 12 sugerujące potencjalne zapotrzebowanie na współczynniki t2o ma . Przekraczasz te granice, ponieważ boyh acf91) i acf (12) są „niebezpiecznie blisko”. Możesz skontaktować się ze mną bezpośrednio na mój opublikowany adres e-mail dostępny z moich informacji.
IrishStat
Miło napisać. „Model ARIMA odzwierciedlający korektę dla trzech nietypowych punktów danych” Mówisz, że dodajesz trzy zmienne zastępcze dla tych trzech punktów? W kategoriach laika, w jaki sposób te trzy wartości odstające są uwzględniane w przyszłych prognozach? (Jestem pewien, że to proste, po prostu się z tym nie zaznajomię). Wygląda również na to, że granice błędów nie rosną z upływem czasu. (A może ograniczenie błędu zależy od modalności kroku?) Z góry dziękuję.
Adam
@Adam trzy zmienne fikcyjne nie odgrywają żadnej roli w prognozowaniu, ponieważ wszystkie przyszłe wartości wynoszą 0. Tak, przedstawione granice błędów są niepoprawne. Usunęliśmy tę lukę, a teraz AUTOBOX przedstawia coraz większe granice błędów w miarę upływu czasu. Jestem jednym z programistów AUTOBOX. .
IrishStat
@IrishStat „trzy zmienne obojętne nie odgrywają żadnej roli w prognozowaniu, ponieważ wszystkie przyszłe wartości wynoszą 0.” Czy to w istocie oznacza, że ​​są one usuwane z danych? Muszą mieć wpływ na limity prognoz?
Adam
15

Próbowałem to zrobić w rozdziale 7 mojego podręcznika z 1998 roku z Makridakis i Wheelwright. Czy mi się uda, czy nie, zostawię osąd innym. Możesz przeczytać część rozdziału online przez Amazon (od p311). Wyszukaj „ARIMA” w książce, aby przekonać Amazon do wyświetlenia odpowiednich stron.

Aktualizacja: Mam nową książkę, która jest bezpłatna i online. Rozdział ARIMA jest tutaj .

Rob Hyndman
źródło
3

Polecam Prognozowanie z jednoczynnikowej Box - Jenkins modele: Concepts and Cases Alan Pankratz. Ta klasyczna książka ma wszystkie funkcje, o które prosiłeś:

  • używa minimalnej matematyki
  • rozszerza dyskusję poza budowanie modelu na wykorzystanie tego modelu do prognozowania konkretnych przypadków
  • wykorzystuje grafikę, a także wyniki numeryczne, aby scharakteryzować dopasowanie wartości prognozowanych do rzeczywistych.

Jedyną wadą jest to, że został wydrukowany w 1983 roku i może nie zawierać ostatnich zmian. Wydawca wyda drugą edycję w styczniu 2014 r. Z aktualizacjami.

wróżka
źródło
Poleciłbym także inną książkę Alana Pankratza: Prognozowanie za pomocą dynamicznych modeli regresji. Bardzo podobny materiał, ale obejmuje nieco więcej gruntu; aczkolwiek mniej szczegółowo po stronie Box-Jenkins. Miło słyszeć, że w styczniu 2014 r. Odbędzie się druga edycja!
Graeme Walsh,
-4

Model ARIMA jest po prostu średnią ważoną. Odpowiada na podwójne pytanie;

  1. Ile kropki (k) powinienem zastosować do obliczenia średniej ważonej

i

  1. Dokładnie jakie są wagi k

Odpowiada na modlitwę dziewicy, aby ustalić, jak dostosować się do poprzednich wartości (i poprzednich wartości SAMOTNIE), aby rzutować serię (co tak naprawdę jest spowodowane nieokreślonymi zmiennymi przyczynowymi). Zatem model ARIMA jest modelem przyczynowym biedaka.

IrishStat
źródło
-1 Ta odpowiedź nie wydaje się odpowiadać na pytanie, które szuka „dobrze wyjaśnionego ... * przykładu *”.
whuber
@whuber: OP poprosił o odpowiedź, która „używa minimalnej matematyki”. Moja odpowiedź wyszczególniła minimalną matematykę i była zmotywowana do wyjaśnienia modeli ARIMA zwykłymi, codziennymi słowami. Nie dzieje się tak nigdy, ponieważ faceci teorii matematyki skupiają się na „wysokiej klasy objaśnieniach” za pomocą wielomianów, operatorów różniczkujących, optymalizacji nieliniowej itp.
IrishStat
@Irish Zgadzam się z motywacją do obniżenia matematyki, szczególnie na żądanie użytkownika. Ale ta odpowiedź wydaje się odpowiadać na inne pytanie: „czym jest ARIMA”. Specyfika pierwotnego pytania wskazuje również, że PO ma dobre pojęcie o tym, czym jest ARIMA i do czego jest dobre; chcą zobaczyć to w akcji. Założę się, że z łatwością mógłbyś wnieść takie studium przypadku :-).
whuber
: whuber: Byłoby to dla mnie bardzo łatwe i mógłbym to zrobić.
IrishStat
@Irish Nie mogę się doczekać, aby to zobaczyć. Co więcej - ten problem nie pojawił się tutaj, ale pojawił się w innych miejscach - takie wkłady są potencjalnie silniejsze i bardziej doceniane, sposoby informowania ludzi o tym, co możesz zrobić, niż wiele bardziej jawnych form marketingu.
whuber