Jak porównać modele na podstawie AIC?

15

Mamy dwa modele, które używają tej samej metody do obliczania prawdopodobieństwa logarytmicznego, a AIC dla jednego jest niższy niż drugi. Jednak ten z niższym AIC jest znacznie trudniejszy do interpretacji.

Mamy problem z podjęciem decyzji, czy warto wprowadzić trudność, i oceniliśmy to na podstawie różnicy procentowej w AIC. Stwierdziliśmy, że różnica między dwoma AIC wynosiła tylko 0,7%, przy czym bardziej skomplikowany model ma AIC o 0,7% niższy.

  1. Czy niska różnica procentowa między nimi jest dobrym powodem, aby unikać używania modelu z niższym AIC?

  2. Czy procent różnicy wyjaśnia, że ​​w mniej skomplikowanym modelu traci się 0,7% więcej informacji?

  3. Czy oba modele mogą mieć bardzo różne wyniki?

Ali Turab Lotia
źródło
2
@ArunJose, to nie wydaje się być duplikatem. Pytania tutaj są zupełnie inne.
Richard Hardy,
1
Nie. To pytanie nie dotyczy porównywalności modeli. Wiemy już, że modele są porównywalne. To pytanie dotyczy tego, co liczy się jako znacząca różnica w AIC i kompromis między złożonością a dopasowaniem modelu.
Ali Turab Lotia

Odpowiedzi:

27

Nie ma porównać wartości bezwzględnych dwóch PTK (który może być podobny , ale także ~ 1000000 ), ale uważa ich różnic : Δ I = I C I - I C, m i n , gdzie I C I jest AIC i-tego modelu, a A I C m i n jest najniższym AIC, jaki uzyskuje się spośród zestawu badanych modeli (tj. Preferowanego modelu). Zasada praktyczna, przedstawiona np. W1001000000

Δja=ZAjadoja-ZAjadomjan,
ZAjadojajaZAjadomjanBurnham i Anderson 2004 to:
  1. jeśli , wówczas istnieje znaczące poparcie dla i-tego modelu (lub dowody przeciwko niemu są warte jedynie krótkiej wzmianki), a twierdzenie, że jest to właściwy opis, jest wysoce prawdopodobne;Δja<2)ja
  2. jeśli , wówczas istnieje silne poparcie dla i-tego modelu;2)<Δja<4ja
  3. jeśli , wówczas poparcie dla i-tego modelu jest znacznie mniejsze ;4<Δja<7ja
  4. Modele z mają zasadniczo żadnego wsparcia.Δja>10

Jeśli chodzi o 0,7% wspomniane w pytaniu, rozważ dwie sytuacje:

  1. ZAjado1=ZAjadomjan=100ZAjado2)ZAjado2)=100,7Δ2)=0,7<2)
  2. ZAjado1=ZAjadomjan=100000ZAjado2)ZAjado2)=100700Δ2)=70010

Dlatego stwierdzenie, że różnica między AIC wynosi 0,7%, nie dostarcza żadnych informacji.

L.ΔjaΔja=ZAjadoja-ZAjadomjanZAjadomjan: =0

Sformułowanie AIC karze stosowanie nadmiernej liczby parametrów, dlatego zniechęca do nadmiernego dopasowania. Preferuje modele o mniejszej liczbie parametrów, o ile inne nie zapewniają znacznie lepszego dopasowania. AIC próbuje wybrać model (spośród badanych), który najlepiej opisuje rzeczywistość (w postaci badanych danych). Oznacza to, że w rzeczywistości model będący prawdziwym opisem danych nigdy nie jest brany pod uwagę. Zauważ, że AIC daje ci informację, który model lepiej opisuje dane, nie daje żadnej interpretacji .

ΔjaΔja<2)Δja<5

ja

pja=exp(-Δja2)),

ZAjadomjanjaΔja=1.5pja=0,47Δja=15pja=0,0005jaZAjadomjan

Wreszcie w odniesieniu do wzoru na AIC:

ZAjado=2)k-2)L.,

L.Δja2)kΔja2)Δk<1

TL; DR

  1. To zły powód; wykorzystać różnicę między wartościami bezwzględnymi AIC.
  2. Procent nic nie mówi.
  3. Nie można odpowiedzieć na to pytanie, ponieważ nie ma informacji o modelach, danych i co oznaczają różne wyniki .
corey979
źródło
2
To najjaśniejsze wytłumaczenie, jakie kiedykolwiek widziałem na temat tej tajemniczej sprawy. Przejrzałem artykuł, do którego się odwołujesz (str. 270–272), a twoje wyjaśnienie tutaj jest prostym i jasnym, ale bardzo dokładnym przedstawieniem tego, co artykuł wyjaśnia.
Tripartio
Czy mógłbyś pomóc w odpowiedzi na to pytanie? stats.stackexchange.com/questions/349883/…
Tripartio