Mamy dwa modele, które używają tej samej metody do obliczania prawdopodobieństwa logarytmicznego, a AIC dla jednego jest niższy niż drugi. Jednak ten z niższym AIC jest znacznie trudniejszy do interpretacji.
Mamy problem z podjęciem decyzji, czy warto wprowadzić trudność, i oceniliśmy to na podstawie różnicy procentowej w AIC. Stwierdziliśmy, że różnica między dwoma AIC wynosiła tylko 0,7%, przy czym bardziej skomplikowany model ma AIC o 0,7% niższy.
Czy niska różnica procentowa między nimi jest dobrym powodem, aby unikać używania modelu z niższym AIC?
Czy procent różnicy wyjaśnia, że w mniej skomplikowanym modelu traci się 0,7% więcej informacji?
Czy oba modele mogą mieć bardzo różne wyniki?
model-selection
aic
Ali Turab Lotia
źródło
źródło
Odpowiedzi:
Nie ma porównać wartości bezwzględnych dwóch PTK (który może być podobny , ale także ~ 1000000 ), ale uważa ich różnic : Δ I = I C I - I C, m i n , gdzie I C I jest AIC i-tego modelu, a A I C m i n jest najniższym AIC, jaki uzyskuje się spośród zestawu badanych modeli (tj. Preferowanego modelu). Zasada praktyczna, przedstawiona np. W∼ 100 ∼ 1000000
Jeśli chodzi o 0,7% wspomniane w pytaniu, rozważ dwie sytuacje:
Dlatego stwierdzenie, że różnica między AIC wynosi 0,7%, nie dostarcza żadnych informacji.
Sformułowanie AIC karze stosowanie nadmiernej liczby parametrów, dlatego zniechęca do nadmiernego dopasowania. Preferuje modele o mniejszej liczbie parametrów, o ile inne nie zapewniają znacznie lepszego dopasowania. AIC próbuje wybrać model (spośród badanych), który najlepiej opisuje rzeczywistość (w postaci badanych danych). Oznacza to, że w rzeczywistości model będący prawdziwym opisem danych nigdy nie jest brany pod uwagę. Zauważ, że AIC daje ci informację, który model lepiej opisuje dane, nie daje żadnej interpretacji .
Wreszcie w odniesieniu do wzoru na AIC:
TL; DR
źródło