R glm i glmnet używają różnych algorytmów.
Kiedy używam obu, zauważam nietrywialne różnice między oszacowanymi współczynnikami.
Interesuje mnie, kiedy jedna jest bardziej dokładna od drugiej, i czas na rozwiązanie / kompromis.
W szczególności mam na myśli przypadek, w którym ustawia się lambda = 0 w glmnet st, szacuje się to samo, co glm.
r
generalized-linear-model
glmnet
Will Beauchamp
źródło
źródło
Odpowiedzi:
Glmnet służy do regresji elastycznej siatki. Powoduje to karanie wielkości szacowanych współczynników (poprzez połączenie kar L1 i L2). Próbuje wyjaśnić jak najwięcej wariancji danych w modelu, przy zachowaniu niewielkich współczynników modelu. Znalazłem te slajdy pomocne w ich zrozumieniu.
Glm nie używa kary.
Efekt, jak rozumiem, że przy elastycznej siatce możesz zaakceptować pewne odchylenie w zamian za zmniejszenie wariancji estymatora. To, co jest najlepsze, musi zależeć od tego, jak zdefiniujesz „najlepsze” pod względem stronniczości i wariancji. (Np. Wiem, że glmnet ma zalety, gdy masz wiele funkcji w porównaniu do obserwacji)
źródło