Chris Chatfield, którego wiele wysokiej jakości książek i artykułów lubiłem czytać, w (1) udziela następujących rad:
Na przykład prawdopodobnie należy dokonać wyboru między modelami szeregów czasowych ARIMA o niskich i w przybliżeniu równych wartościach AIC, nie na podstawie tego, co daje minimalny AIC, ale na podstawie których można uzyskać najlepsze prognozy danych z ostatniego roku.
Jakie jest uzasadnienie takiej porady? Jeśli to jest prawidłowe, dlaczego prognoza :: auto.arima i inne procedury prognozowania nie podążają za nim? Jeszcze do wdrożenia? Zostało już tutaj omówione, że szukanie modeli, które właśnie dały minimalny AIC, prawdopodobnie nie jest dobrym pomysłem. Dlaczego opcja posiadania modeli ARIMA o niskim, ale w przybliżeniu równym (np. W granicach 1 lub 2 wartości minimalnego AIC), nie jest domyślna w większości programów do prognozowania szeregów czasowych?
(1) Chatfield, C. (1991). Unikanie pułapek statystycznych. Nauki statystyczne, 6 (3), 240–252. Dostępny online, URL: https://projecteuclid.org/euclid.ss/1177011686 .
źródło
Odpowiedzi:
Prawdą jest, że jeśli masz wiele wartości AIC w przybliżeniu równych, wybór najniższej wartości może nie być najlepszą opcją. Rozsądną alternatywą byłoby przeprowadzenie uśredniania modelu. W ten sposób możesz użyć nie tylko najlepszego modelu wnioskowania, ale zestawu „najbardziej obsługiwanych” modeli ważonych zgodnie z ich wartością AIC.
Masz krótkie wprowadzenie przez Vincenta Calcagno tutaj
źródło