W modelach szeregów czasowych, takich jak ARMA-GARCH, do wyboru odpowiedniego opóźnienia lub kolejności modelu stosowane są różne kryteria informacyjne, takie jak AIC, BIC, SIC itp.
Moje pytanie jest bardzo proste, dlaczego nie używamy skorygowanego aby wybrać odpowiedni model? Możemy wybrać model, który prowadzi do wyższej wartości skorygowanego . Ponieważ zarówno skorygowane i kryterium informacyjne karają za dodatkową liczbę regresorów w modelu, gdzie poprzednio karano a później karano wartość prawdopodobieństwa.
regression
time-series
model-selection
aic
bic
Neeraj
źródło
źródło
Odpowiedzi:
Twierdziłbym, że przynajmniej przy omawianiu modeli liniowych (takich jak modele AR) skorygowane i AIC nie różnią się tak bardzo.R2
Zastanów się, czy powinno być uwzględnione w Jest to równoważne z porównaniem Modele gdzie . Mówimy, że jest prawdziwym modelem, jeśliX2
MówimyMˆ jest spójny, jeśli
Rozważ skorygowane . To znaczy wybierz jeśli . Ponieważ monotonicznie zmniejsza się , procedura ta jest równoważna zminimalizowaniu . To z kolei jest równoważne zminimalizowaniu . W przypadku wystarczająco dużego , to ostatnie można zapisać jako gdzieR2 M1 R¯21>R¯22 R¯2 s2 s2 log(s2) n
Twierdzenie :
Dowód : gdzie następuje linia od drugiej do ostatniej, ponieważ statystyka jest statystyką LR w przypadku regresji liniowej, która następuje po asymptozie dystrybucja zerowa. CO BYŁO DO OKAZANIA
Rozważmy teraz kryterium Akaike, Tak więc AIC wymienia również redukcję SSR sugerowaną przez dodatkowe regresory w stosunku do „kary” , ”który wskazuje w przeciwnym kierunku. Dlatego wybierz jeśli , w przeciwnym razie wybierz .
Można zauważyć, że jest również niespójny, kontynuując powyższy dowód w wierszu trzecim z . Skorygowane i wybierają zatem „duży” model z prawdopodobieństwem dodatnim, nawet jeśli jest prawdziwym modelem.AIC P(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1) R2 AIC M2 M1
Ponieważ kara za złożoność w AIC jest nieco większa niż za skorygowane , może być jednak mniej podatna na przebarwienie. I ma inne miłe właściwości (minimalizujące rozbieżność KL do prawdziwego modelu, jeśli nie ma go w rozważanym zestawie modeli), które nie są omówione w moim poście.R2
źródło
Kara w nie daje dobrych właściwości pod względem wyboru modelu, jakie posiada AIC lub BIC. Kara w wystarczy, aby uczynić obiektywnym estymatorem populacji gdy żaden regresor nie należy do modelu (zgodnie z postami Dave'a Gilesa na blogu „In What Sense” czy „Skorygowany” R-kwadrat jest bezstronny? ” i „ Więcej na temat właściwości „Skorygowanego” współczynnika determinacji ” ); jednak nie jest optymalnym wyborem modelu.R2adj R2adj R2adj R2 R2adj
(Może istnieć dowód sprzeczności: jeśli AIC jest optymalny w jednym sensie, a BIC jest optymalny w innym, a nie jest równoważny z żadnym z nich, to nie jest optymalny w żadnym z nich tych dwóch zmysłów).R2adj R2adj
źródło