W regresji lasso lub kalenicy należy określić parametr skurczu, często nazywany przez lub . Ta wartość jest często wybierana poprzez krzyżową weryfikację, sprawdzając kilka różnych wartości danych treningowych i sprawdzając, która daje najlepszą wartość, np. na danych testowych. Jaki zakres wartości należy sprawdzić? Czy to ?
regression
lasso
regularization
ridge-regression
penalized
rombidodekeded
źródło
źródło
Odpowiedzi:
Naprawdę nie musisz się tym przejmować. W większości pakietów (takich jak glmnet), jeśli nie podasz , pakiet oprogramowania generuje własną sekwencję (co jest często zalecane). Powodem, dla którego podkreślam tę odpowiedź, jest to, że podczas działania LASSO solver generuje sekwencję , więc chociaż może być sprzeczne z intuicją, podanie pojedynczej wartości może w rzeczywistości znacznie spowolnić solver (Po podaniu dokładnego parametru solver polega na rozwiązaniu półokreślonego programu, który może być powolny w uzasadnionych „prostych” przypadkach).λ λ λ
Jeśli chodzi o dokładną wartość , możesz potencjalnie wybrać cokolwiek z . Zauważ, że jeśli twoja wartość jest zbyt duża, kara będzie zbyt duża, a zatem żaden ze współczynników nie może być niezerowy. Jeśli kara będzie zbyt mała, dopasujesz model i nie będzie to najlepsze rozwiązanie sprawdzone krzyżowoλ [ 0 , ∞ [ λ
źródło