Metodologia Box-Jenkins to strategia lub procedura, którą można wykorzystać do zbudowania modelu ARIMA. Metodologię opisano w książce Time Series Analysis: Forecasting and Control autorstwa George EP Box i Gwilym M. Jenkins, pierwotnie opublikowanej w 1970 r. - istnieją nowsze wersje.
Otwierając SAS, wywołując proc ARIMA i podając numery p, d i q, oszacowałeś tylko model ARIMA. Robienie tego na ślepo, to znaczy nie stosowanie żadnej konkretnej uznanej metodologii do identyfikacji samego modelu ARIMA, przypomina trochę grę z zapałkami - niebezpieczeństwa związane z oprogramowaniem!
Jeśli będziesz powtarzać ten proces - szacując wiele modeli ARIMA - w końcu będziesz mógł wybrać model z najniższym kryterium Informacji Akaike (z zestawu modeli, które oszacowałeś). W tym kontekście bardziej systematyczne podejście polegałoby na zastosowaniu algorytmu opartego na porównaniu wartości AIC dla różnych modeli, aby automatycznie wybrać model ARIMA dla ciebie, taki jak ten dostarczony przez pakiet prognozy w R - nazwa odpowiedniej funkcji jest auto.arima()
.
W każdym razie opisana przez ciebie procedura obejmowała wybór modelu ARIMA w oparciu o zminimalizowanie pewnego kryterium informacyjnego (w tym przypadku AIC, ale istnieją inne miary). Jest to jedna szczególna metodologia, ale nie jest to metodologia Boxa-Jenkinsa; alternatywa.
Metodologia Boxa-Jenkinsa składa się z pięciu etapów (choć czasami mówi się, że obejmują tylko trzy etapy):
- Sprawdzanie stacjonarności lub niestacjonarności i przekształcanie danych, jeśli to konieczne;
- Identyfikacja odpowiedniego modelu ARMA;
- Oszacowanie parametrów wybranego modelu;
- Kontrola diagnostyczna adekwatności modelu; i
- Prognozowanie lub powtórzenie kroków od drugiego do piątego.
W szczególności jest to proces iteracyjny, w którym konstruktor modeli dokonuje pewnej oceny - i jest to jeden aspekt metodologii, który uznano za wadę. Część osądowa ma znaczenie, szczególnie przy interpretacji dwóch narzędzi; mianowicie (szacunkowa) funkcja autokorelacji (ACF) i funkcja częściowej autokorelacji (PACF).
Jeśli chcesz zostać praktykiem metodologii Boxa-Jenkinsa, zaleciłbym zapoznanie się z oryginalnym tekstem (zdziwiłbyś się, co pomijają współczesne podręczniki!) Obok wszelkich nowoczesnych odmian, jakie możesz znaleźć. Alan Pankratz ma kilka doskonałych podręczników, które również bardzo polecam; na przykład Prognozowanie za pomocą Univariate Box-Jenkins Models: Concepts and Cases .
Doświadczenie sugeruje mi, że termin „metodologia Boxa-Jenkinsa” jest używany w luźny sposób, ponieważ słyszałem, że niektórzy ludzie używają go do zwykłego odniesienia do budowy modeli ARIMA w ogóle - a nie do rzeczywistego procesu związanego z budowaniem modelu ARIMA - podczas gdy inni używają go w odniesieniu do zmodyfikowanej wersji tego, co zostało opublikowane w 1970 roku. Jak zauważył @Glen_b, „istnieje wiele dokumentów opisujących metodologię Boxa-Jenkinsa, które obejmowałyby użycie AIC lub podobnych ilości” .
P: Czy powinieneś użyć metodologii Boxa-Jenkinsa, aby uzyskać wstępne szacunki p, d, q?
Jak już wspomniano, istnieją różne strategie wyboru modelu, więc odpowiedź brzmi: nie, niekoniecznie jest tak, że musisz zastosować metodologię Box-Jenkins, ale możesz, jeśli chcesz.
P: Czy SAS użył go w jakiś sposób wewnętrznie?
Bardzo mało prawdopodobne, chyba że oprogramowanie to oferuje dość wyrafinowaną funkcję! Zapoznaj się z oficjalną dokumentacją SAS, aby uzyskać szczegółowe informacje na temat działania lub możliwości oprogramowania. Gdyby to był R, mógłbyś spojrzeć na kod źródłowy, ale wątpię, żeby była to opcja z SAS.