Buduję regresję logistyczną w R za pomocą metody LASSO z funkcjami cv.glmnet
wyboru lambda
i glmnet
dla ostatecznego modelu.
Znam już wszystkie wady związane z automatycznym wyborem modelu, ale i tak muszę to zrobić.
Mój problem polega na tym, że muszę uwzględnić zmienne czynnikowe (modelowe) w modelu. Czy można to zrobić bez tworzenia wielu zmiennych zastępczych? Te zmienne to prawie wszystkie ciągi, a nie liczby.
Odpowiedzi:
glmnet nie może brać czynnika bezpośrednio, musisz przekształcić zmienne czynnikowe w manekiny. To tylko jeden prosty krok przy użyciu model.matrix, na przykład:
alfa = 1 zbuduje LASSO.
źródło