Procedura wyboru modelu Boxa-Jenkinsa w analizie szeregów czasowych rozpoczyna się od przyjrzenia się funkcjom autokorelacji i częściowej autokorelacji w serii. Te wykresy mogą sugerować odpowiednie i q w modelu ARMA ( p , q ) . Procedura jest kontynuowana, prosząc użytkownika o zastosowanie kryteriów AIC / BIC w celu wybrania najbardziej oszczędnego modelu spośród tych, które wytwarzają model z terminem błędu białego szumu.
Zastanawiałem się, jak te etapy kontroli wzrokowej i wyboru modelu opartego na kryteriach wpływają na szacowane standardowe błędy ostatecznego modelu. Wiem, że wiele procedur wyszukiwania w domenie przekrojowej może na przykład odchylać standardowe błędy w dół.
W pierwszym kroku, w jaki sposób wybór odpowiedniej liczby opóźnień na podstawie danych (ACF / PACF) wpływa na standardowe błędy modeli szeregów czasowych?
Sądzę, że wybór modelu na podstawie wyników AIC / BIC miałby wpływ analogiczny do tego dla metod przekrojowych. Właściwie nie wiem zbyt wiele o tym obszarze, więc wszelkie uwagi byłyby mile widziane w tej kwestii.
Na koniec, jeśli zapisałeś dokładne kryterium zastosowane dla każdego kroku, czy możesz uruchomić cały proces, aby oszacować standardowe błędy i wyeliminować te obawy?
Odpowiedzi:
Każda procedura wyboru modelu wpłynie na standardowe błędy i rzadko jest to brane pod uwagę. Na przykład przedziały prognozowania są obliczane warunkowo na modelu szacunkowym, a estymacja parametrów i wybór modelu są zwykle ignorowane.
Powinna istnieć możliwość przeładowania całej procedury w celu oszacowania efektu procesu wyboru modelu. Pamiętaj jednak, że ładowanie szeregów czasowych jest trudniejsze niż normalne ładowanie, ponieważ musisz zachować korelację szeregową. Blokowanie ładowania jest jednym z możliwych podejść, chociaż traci pewną korelację szeregową z powodu struktury bloku.
źródło
Moim zdaniem wybór odpowiedniej liczby opóźnień nie różni się niczym od wyboru szeregu wejściowego w procedurze regresji krokowej do przodu. Przyrostowe znaczenie opóźnień lub określonej serii danych wejściowych stanowi podstawę specyfikacji modelu tymczasowego.
Ponieważ stwierdziłeś, że acf / pacf jest jedyną podstawą do wyboru modelu Boxa-Jenkinsa, powiem ci, czego nauczyło mnie pewne doświadczenie. Jeśli seria wykazuje acf, który nie ulega rozkładowi, podejście Boxa-Jenkinsa (około 1965 r.) Sugeruje różnicowanie danych. Ale jeśli seria ma przesunięcie poziomu, takie jak dane Nilu , to „widoczna” niestacjonarność jest objawem potrzebnej struktury, ale różnicowanie nie jest rozwiązaniem. Ten zestaw danych Nilu można modelować bez różnicowania, po prostu identyfikując najpierw potrzebę przesunięcia poziomu. W podobny sposób uczymy się, używając 1960 koncepcji, że jeśli acf wykazuje strukturę sezonową ( tjznaczące wartości przy opóźnieniach s, 2s, 3s, ...), wówczas powinniśmy uwzględnić sezonowy składnik ARIMA. Do celów dyskusji rozważ serię, która jest stacjonarna wokół średniej, aw ustalonych odstępach czasu, powiedz, że w czerwcu jest „wysoka wartość”. Ta seria jest odpowiednio traktowana poprzez włączenie „staromodnej” serii manekinów 0 i 1 (w czerwcu) w celu potraktowania struktury sezonowej. Sezonowy model ARIMA niepoprawnie używałby pamięci zamiast nieokreślonej, ale czekającej na znalezienie zmiennej X. Te dwie koncepcje identyfikowania / włączania nieokreślonej deterministycznej struktury są bezpośrednimi zastosowaniami pracy I. Changa, Williama Bella, George'a Tiao, R. Tsaya , Chen i in. (Począwszy od 1978 r.) W ramach ogólnej koncepcji wykrywania interwencji.
Nawet dzisiaj niektórzy analitycy bezmyślnie realizują strategie maksymalizacji pamięci, nazywając je Automatic ARIMA, nie uznając, że „bezmyślne modelowanie pamięci” zakłada, że deterministyczna struktura, taka jak impulsy, przesunięcia poziomów, pulsacje sezonowe i trendy czasu lokalnego nie istnieją lub są gorsze, ale nie grają rola w identyfikacji modelu. Jest to podobne do wkładania głowy w piasek, IMHO.
źródło