Obecnie pracuję nad budowaniem modelu predykcyjnego dla wyniku binarnego na zbiorze danych z ~ 300 zmiennymi i 800 obserwacjami. Dużo przeczytałem na tej stronie o problemach związanych z regresją krokową i dlaczego jej nie używać.
Czytałem o regresji LASSO i jej możliwościach wyboru funkcji i udało mi się ją wdrożyć za pomocą pakietu „caret” i „glmnet”.
Jestem w stanie wyodrębnić współczynnik modelu z optymalnym lambda
iz alpha
„daszka”; nie znam jednak sposobu interpretacji współczynników.
- Czy współczynniki LASSO są interpretowane tą samą metodą co regresja logistyczna?
- Czy właściwe byłoby użycie funkcji wybranych z LASSO w regresji logistycznej?
EDYTOWAĆ
Interpretacja współczynników, jak w przypadku współczynników potęgowanych z regresji LASSO, jako logarytmicznych szans na zmianę jednostki o 1 jednostkę przy jednoczesnym utrzymaniu wszystkich pozostałych współczynników na stałym poziomie.
multiple-regression
predictive-models
interpretation
regression-coefficients
lasso
Michael Luu
źródło
źródło
Odpowiedzi:
Pozwólcie, że sformułuję : Czy współczynniki LASSO są interpretowane w taki sam sposób, jak na przykład współczynniki maksymalnego prawdopodobieństwa
OLSw regresji logistycznej?LASSO (metoda szacowania karanego) ma na celu oszacowanie tych samych wielkości (współczynników modelu), co powiedzmy, maksymalne prawdopodobieństwo
OLS(metoda niezenalizowana). Model jest taki sam, a interpretacja pozostaje taka sama. Wartości liczbowe z LASSO będą zwykle różnić się od wartości z maksymalnego prawdopodobieństwaOLS: niektóre będą bliższe zeru, inne będą dokładnie zerowe. Jeżeli zastosowana zostanie rozsądna ilość kary, oszacowania LASSO będą leżeć bliżej prawdziwych wartości niż oszacowania maksymalnego prawdopodobieństwaOLS, co jest pożądanym wynikiem.Nie ma z tym nieodłącznego problemu, ale możesz użyć LASSO nie tylko do wyboru funkcji, ale także do oszacowania współczynnika. Jak wspomniałem powyżej, szacunki LASSO mogą być dokładniejsze niż, powiedzmy, szacunki maksymalnego prawdopodobieństwa
OLS.źródło