Pytanie Co wyciągnąć z tego wykresu lasso (glmnet) pokazuje ścieżki rozwiązania estymatora lasso, które nie są monotoniczne. Oznacza to, że niektórzy współpracownicy rosną w wartości bezwzględnej, zanim się skurczą.
Zastosowałem te modele do kilku różnych rodzajów zestawów danych i nigdy nie widziałem tego zachowania „na wolności” i do dziś zakładałem, że zawsze były monotoniczne.
Czy istnieje wyraźny zestaw warunków, w których ścieżki rozwiązania są gwarantowane jako monotonne? Czy wpływa to na interpretację wyników, jeśli ścieżki zmienią kierunek?
lasso
ridge-regression
elastic-net
Shadowtalker
źródło
źródło
Odpowiedzi:
Mogę dać ci wystarczającą przesłankę ścieżka być monotoniczne: AN ortonormalną projektX .
Załóżmy, że macierz projektu ortonormalnego, czyli ze zmiennymi , mamy . W przypadku projektu ortonormalnego współczynniki regresji OLS są po prostu .X X ′ Xp X p öLs=X'YX′Xn= Jap β^o l s= X′yn
Warunki Karush-Khun-Tucker dla LASSO upraszczają zatem:
Gdzie jest pod gradientem. Dlatego dla każdego mamy , a my mieć zamkniętą formę rozwiązania szacunków lasso:J ∈ { 1 , ... , p } β O l a j = β l s s O j + λ y js j ∈ { 1 , … , p } β^o l sjot= β^l a s s ojot+ λ sjot
Który jest monotoniczny w . Chociaż nie jest to warunek konieczny, widzimy, że zakaz monotoniczność musi pochodzić od korelacji zmiennych objaśniających w .Xλ X
źródło