Czy można obliczyć wartości AIC lub BIC dla modeli regresji lasso i innych modeli znormalizowanych, w których parametry tylko częściowo wchodzą do równania. Jak określa się stopnie swobody?
Używam R, aby dopasować modele regresji lasso z glmnet()
funkcją z glmnet
pakietu i chciałbym wiedzieć, jak obliczyć wartości AIC i BIC dla modelu. W ten sposób mogę porównać wartości z modelami pasującymi bez regularyzacji. Czy to się da zrobić?
Odpowiedzi:
Interesujące mogą być również następujące artykuły:
źródło
Dużo walczyłem ze sposobem obliczenia AIC i BIC dla modeli glmnet. Jednak po dość długim wyszukiwaniu znalazłem odpowiedź na trzeciej stronie wyników Google. Można go znaleźć tutaj . Zamieszczam go tutaj dla przyszłych czytelników, ponieważ uważam, że nie mogę być jedynym.
Na koniec zaimplementowałem AIC i BIC w następujący sposób:
źródło
W linku, do którego odwołuje się Johnnyheineken, autor stwierdza:
Wydaje mi się, że jeśli porównujesz AIC między dwoma modelami, fakt, że nie możesz rozdzielić odchylenia zerowego, nie powinien mieć znaczenia. Ponieważ istnieje po obu „stronach” nierówności, pokazałby, który model musi mieć niższy AIC. Zależy to od dwóch rzeczy:
źródło