Czy istnieje wyraźny zestaw warunków, w których ścieżki lasso, grzbiety lub elastyczne siatki są monotonne?

18

Pytanie Co wyciągnąć z tego wykresu lasso (glmnet) pokazuje ścieżki rozwiązania estymatora lasso, które nie są monotoniczne. Oznacza to, że niektórzy współpracownicy rosną w wartości bezwzględnej, zanim się skurczą.

Zastosowałem te modele do kilku różnych rodzajów zestawów danych i nigdy nie widziałem tego zachowania „na wolności” i do dziś zakładałem, że zawsze były monotoniczne.

Czy istnieje wyraźny zestaw warunków, w których ścieżki rozwiązania są gwarantowane jako monotonne? Czy wpływa to na interpretację wyników, jeśli ścieżki zmienią kierunek?

Shadowtalker
źródło
W jakim sensie monotonia? Wydaje mi się to mało znaczące, jeśli chcesz traktować to jako wykres jakiejś funkcji.
Henry.L
4
λ1λ2(β^λ2)j(β^λ1)jjβ^λ=argminβ12nyXβ22+λβ1
2
Uwaga: zrozumienie sposobu, w jaki lasso zmniejsza współczynniki, jest tematem zarówno tego pytania, jak i stats.stackexchange.com/questions/145299/…
user795305
1
Nie wiem, jak to przeoczyłem wcześniej, na pytanie lassa odpowiada odpowiedź OP na jego własne pytanie w powyższym pytaniu.
user795305,

Odpowiedzi:

2

Mogę dać ci wystarczającą przesłankę ścieżka być monotoniczne: AN ortonormalną projekt X .

Załóżmy, że macierz projektu ortonormalnego, czyli ze zmiennymi , mamy . W przypadku projektu ortonormalnego współczynniki regresji OLS są po prostu .X X XpX p öLs=X'YXXn=Ipβ^ols=Xyn

Warunki Karush-Khun-Tucker dla LASSO upraszczają zatem:

Xyn=β^lasso+λsβ^ols=β^lasso+λs

Gdzie jest pod gradientem. Dlatego dla każdego mamy , a my mieć zamkniętą formę rozwiązania szacunków lasso:J { 1 , ... , p } β O l a j = β l s s O j + λ y jsj{1,,p}β^jols=β^jlasso+λsj

β^jlasso=sign(β^jols)(|β^jols|λ)+

Który jest monotoniczny w . Chociaż nie jest to warunek konieczny, widzimy, że zakaz monotoniczność musi pochodzić od korelacji zmiennych objaśniających w .XλX

Carlos Cinelli
źródło