Z Wikipedii istnieje definicja Kryterium Informacyjnego Akaike (AIC) jako , gdzie jest liczbą parametrów, a jest prawdopodobieństwem modelu.
Jednak nasze ekonometria zauważa na szanowanym uniwersytecie, że . Tutaj to oszacowana wariancja błędów w modelu ARMA, a to liczba obserwacji w zestawie danych szeregów czasowych.σ 2T
Czy ta ostatnia definicja jest równoważna pierwszej, ale po prostu dostrojona dla modeli ARMA? Czy istnieje jakiś konflikt między tymi dwiema definicjami?
Odpowiedzi:
Wzór, który zacytowałeś w swoich notatkach, nie jest dokładnie AIC.
AIC wynosi .−2logL+2k
Podam tutaj zarys przybliżonego wyprowadzenia, który wystarczająco jasno wyjaśnia, co się dzieje.
Jeśli masz model z niezależnymi błędami normalnymi o stałej wariancji,
które można oszacować przy maksymalnym prawdopodobieństwie jako
(zakładając, że oszacowanie jest oszacowaniem ML)σ2
Tak (aż do przesunięcia o stałej)−2logL+2k=nlogσ^2+2k
Teraz w modelu ARMA, jeśli jest naprawdę duży w porównaniu do p i q , prawdopodobieństwo może być przybliżone przez taki szkielet Gaussa (np. Możesz napisać ARMA w przybliżeniu jako dłuższy AR i warunek na wystarczających warunkach, aby napisać ten AR jako model regresji), więc z T zamiast n :T p q T n
W związku z tym
Teraz, jeśli po prostu porównujesz AIC, to podział przez nie ma żadnego znaczenia, ponieważ nie zmienia kolejności wartości AIC.T
Jeśli jednak używasz AIC do innych celów, które opierają się na rzeczywistej wartości różnic w AIC (takich jak wnioskowanie wielomodelowe, jak opisali Burnham i Anderson), to ma to znaczenie.
Wiele tekstów ekonometrycznych wydaje się używać tego formularza AIC / T. Co dziwne, niektóre książki wydają się nawiązywać do Hurvicha i Tsai 1989 lub Findley 1985 dla tej formy, ale Hurvich, Tsai i Findley wydają się omawiać oryginalną formę (chociaż mam tylko pośrednie wskazanie, co robi teraz Findley, więc być może jest coś w Findley na ten temat).
Takie skalowanie może być wykonywane z różnych powodów - na przykład szeregi czasowe, szczególnie szeregi czasowe o wysokiej częstotliwości, mogą być bardzo długie, a zwykłe AIC mogą mieć tendencję do zniekształcania się, szczególnie jeśli jest bardzo małe. (Istnieje kilka innych możliwych powodów, ale ponieważ tak naprawdę nie wiem, dlaczego tak się stało, nie zacznę przeglądać listy wszystkich możliwych powodów).σ2
Możesz spojrzeć na listę Robów Hyndmana dotyczącą faktów i błędów AIC , w szczególności punkty od 3 do 7. Niektóre z tych punktów mogą sprawić, że będziesz przynajmniej trochę ostrożny w zbytnim poleganiu na przybliżeniu prawdopodobieństwa Gaussa, ale może jest lepsze uzasadnienie niż tutaj.
Nie jestem pewien, czy istnieje dobry powód, aby użyć tego przybliżenia prawdopodobieństwa dziennika zamiast rzeczywistego AIC, ponieważ obecnie wiele pakietów szeregów czasowych ma tendencję do obliczania (/ maksymalizowania) rzeczywistego prawdopodobieństwa dziennika dla modeli ARMA. Wydaje się, że nie ma powodu, aby go nie używać.
źródło
Uważam, że jest to oparte na założeniu normalnych błędów. W ekonometrii operujesz za pomocą asymptotyków, szczególnie w aplikacjach szeregów czasowych korzystających z AIC. W konsekwencji normalne założenie powinno utrzymywać się asymptotycznie, aby uzasadnić ten (asymptotyczny) schemat wyboru modelu.
źródło