Czy można porównywać wartości AIC, o ile modele są oparte na tym samym zestawie danych?

13

Robię prognozowanie w R, używając pakietu prognozy Roba Hyndmana . Papier należący do paczki można znaleźć tutaj .

W artykule, po wyjaśnieniu algorytmów automatycznego prognozowania, autorzy implementują algorytmy na tym samym zbiorze danych. Jednak po oszacowaniu zarówno wygładzania wykładniczego, jak i modelu ARIMA, formułują stwierdzenie, którego nie rozumiem (na stronie 17):

Pamiętaj, że kryteria informacyjne nie są porównywalne.

Pomyślałem, że zaletą użycia AIC do wyboru modelu jest to, że możemy porównywać wartości AIC z różnych modeli, o ile są one szacowane przy użyciu tego samego zestawu danych. Czy to jest nieprawidłowe?

Ta kwestia jest dla mnie szczególnie interesująca, ponieważ planowałem połączyć prognozy z różnych klas modeli (np. Wygładzanie wykładnicze i ARIMA) przy użyciu tak zwanych wag Akaike (patrz Burnham i Anderson, 2002, w celu omówienia wag Akaike)

Bibliografia

  • Burnham, KP i Anderson, DR (2002). Wybór modelu i wnioskowanie wielomodelowe: praktyczne podejście teoretyczno-informacyjne. Springer Verlag.
tfunk
źródło

Odpowiedzi:

8

Oba modele traktują wartości początkowe inaczej. Na przykład po różnicowaniu model ARIMA jest obliczany na podstawie mniejszej liczby obserwacji, podczas gdy model ETS jest zawsze obliczany na pełnym zestawie danych. Nawet jeśli modele są równoważne (np. ARIMA (0,1,1) i ETS (A, N, N)), wartości AIC będą różne.

W rzeczywistości prawdopodobieństwo modelu ETS jest uwarunkowane wektorem stanu początkowego, natomiast prawdopodobieństwo niestacjonarnego modelu ARIMA uwarunkowane jest kilkoma pierwszymi obserwacjami, nawet jeśli dla elementów niestacjonarnych zastosowano rozproszony poprzednik.

Rob Hyndman
źródło
Dziękuję Ci! To wyjaśnia więcej niż kilka rzeczy. Uwielbiam pakiet prognozy btw!
tfunk