Jak wynika z niedawnej zmiany domyślnej statystyki wyboru modelu w pakiecie prognozy R z AIC na AICc, jestem ciekawy, czy ta ostatnia ma zastosowanie wszędzie tam, gdzie jest ta pierwsza. Mam w związku z tym szereg pytań i oto pierwsze.
Wiem, że zamiana AIC na AICc wszędzie jest tym, co zaleca dobrze znana książka w (1) Burnhama i Andersona ( niestatystycy ), jak tutaj podsumowano . Czasami do książki bezkrytycznie odwołują się młodzi statystycy, patrz np. Komentarze do tego posta na blogu Roba Hyndmana , ale statystyk Brian Ripley doradził w zupełnie inny sposób:
“Burnham and Anderson (2002) is a book I would recommend people NOT read until
they have read the primary literature. I see no evidence that the authors have
actually read Akaike’s papers." [quoted from [AIC MYTHS AND MISUNDERSTANDINGS][4] by
Burnham-Anderson]
Z tego, co Ripley pisze na temat AIC i powiązanej teorii, wynika, że ostrzeżenie należy traktować poważnie. Mam zarówno dobrą kolekcję własnych dokumentów Akaike, jak i książkę Burnham-Anderson. W końcu będę miał własne zdanie na temat jakości książki, ale pomoże to również dowiedzieć się, co myślą o tym statystyki statystyków, zarówno młodych, jak i starszych. W szczególności, czy są profesorowie statystyki (lub inni dobrzy studenci statystyki), którzy wyraźnie zalecili książkę jako przydatne podsumowanie wiedzy na temat korzystania z AIC do wyboru modelu?
Odniesienie:
(1) Burnham, KP i Anderson, wybór modelu i wnioskowanie wielomodelowe: praktyczne podejście teoretyczno-informacyjne Springer, 2002
PS. W odpowiedzi na ostatnią „odpowiedź” stwierdzającą, że „Dr.Burnham jest doktorem statystyki” Chciałbym dodać to wyjaśnienie. Tak, sam jest statystykiem, członkiem ASA i laureatem wielu profesjonalnych nagród, w tym Distinguished Achievement Medal od ASA. Ale kto powiedział, że nie jest? Wszystko, co powiedziałem powyżej, to to, że jako para autorów nie są oni statystykami, a książka odzwierciedla ten fakt.
źródło
Odpowiedzi:
Wydaje się, że PO poszukuje wysokiej jakości ankiety wysokiej jakości statystyk, aby pomóc ocenić, czy jedna konkretna książka jest wysokiej jakości, szczególnie w odniesieniu do debaty AIC kontra AICc. Ta strona nie jest specjalnie ukierunkowana na systematyczne ankiety. Zamiast tego spróbuję odpowiedzieć bezpośrednio na podstawowe pytanie.
Zarówno AIC, jak i AICc oceniają modele według heurystycznego kompromisu między dopasowaniem modelu (pod względem prawdopodobieństwa) a przełożeniem (pod względem liczby parametrów). W tym kompromisie AICc daje nieco większą karę na liczbę parametrów. Dlatego AICc zawsze zaleca modele o złożoności mniejszej lub równej złożoności najlepszego modelu AIC. W tym sensie związek między nimi jest bardzo prosty, pomimo strasznie skomplikowanych argumentów leżących u podstaw ich pochodnych.
AIC i AICc to tylko dwa spośród szerokiego zakresu kryteriów informacji kandydata, przy czym BIC i DIC są być może wiodącymi alternatywami. BIC jest znacznie bardziej konserwatywny (karanie dużej liczby parametrów modelu) niż w większości przypadków AIC lub AICc. Pytanie, które kryterium jest najlepsze, jest naprawdę specyficzne dla problemu. Można słusznie preferować wyjątkowo konserwatywne kryterium w przypadkach, w których potrzebne jest solidne przewidywanie na podstawie próby.
FWIW, stwierdziłem, że poziom konserwatyzmu AICc jest zwykle lepszy niż AIC w obszernych badaniach symulacyjnych dotyczących błędu prognozowania w modelach przechwytywania i wychwytywania.
źródło