Relaksacja Lagrangian w kontekście regresji kalenicowej

15

W „Elementach uczenia statystycznego” (wydanie drugie), s. 63, autorzy podają następujące dwa sformułowania problemu regresji kalenicy:

β^ridge=argminβ{i=1N(yiβ0j=1pxijβj)2+λj=1pβj2}

i

β^ridge=argminβi=1N(yiβ0j=1pxijβj)2, subject to j=1pβj2t.

Uważa się, że te dwa są równoważne, i że istnieje przyporządkowanie jeden-do-jednego między parametrami i .λt

Wydaje się, że pierwsze sformułowanie jest lagranżowskim rozluźnieniem drugiego. Jednak nigdy nie miałem intuicyjnego zrozumienia, jak i dlaczego działają relaksacje Lagrangian.

Czy istnieje prosty sposób wykazania, że ​​te dwa preparaty są rzeczywiście równoważne? Gdybym musiał wybrać, wolałbym intuicję niż rygor.

Dzięki.

NPE
źródło
Jeśli potrzebujesz jedynie intuicyjnego wyjaśnienia, przejdź do 1.03.26 tego filmu (do końca), istnieje intuicyjne wyjaśnienie, w jaki sposób ograniczenia odnoszą się do funkcji celu.
user603

Odpowiedzi:

3

Korespondencję można najłatwiej pokazać za pomocą twierdzenia o kopercie .

λtλ

ttβλt

t

Zakładam, że taka jest korespondencja Hastie i in. odnoszą się do.

Tristan
źródło