normą jest unikalny (przynajmniej częściowo), ponieważ znajduje się na granicy między uwypuklony i wypukłe. normą jest „najbardziej rzadki” norma wypukły (prawda?). p = 1 L 1
Rozumiem, że norma euklidesowa ma korzenie w geometrii i ma jasną interpretację, gdy wymiary mają te same jednostki. Ale nie rozumiem, dlaczego jest stosowany preferencyjnie w porównaniu z innymi liczbami rzeczywistymi : ? ? Dlaczego nie wykorzystać pełnego ciągłego zakresu jako hiperparametru?p > 1p = π
czego mi brakuje?
regression
regularization
sparse
Trenton
źródło
źródło
Odpowiedzi:
Bardziej matematycznym wyjaśnieniem jest to, że przestrzeń , składająca się ze wszystkich szeregów zbiegających się w p-normie, to tylko Hilbert z i bez żadnej innej wartości. Oznacza to, że ta przestrzeń jest kompletna, a norma na tej przestrzeni może być indukowana przez produkt wewnętrzny (pomyśl o znanym iloczynie w ), więc jest trochę przyjemniej pracować. p = 2 R nlp p=2 Rn
źródło
Oto kilka powodów:
Jest to związane w bardzo szczególny sposób z produktem wewnętrznym: jest to jego własna podwójna norma (tj. Jest „podwójna”).ℓ2 z ℓ2 z ∥x∥22=x⋅x ℓp
Oznacza to, że jeśli weźmie się pod uwagę wszystkie wektory wewnątrz jednostkowej , ich maksymalny iloczyn wewnętrzny z dowolnym wektorem jest normą samej . Mniej fantazyjnie spełnia właściwość, że . Żadna inna norma zachowuje się w ten sposób.
Ma bardzo dogodnie płynny gradient: Naprawdę nie możesz tego pokonać!
źródło
Chociaż może być wiele innych powodów, ale AFAIK p = 2 jest preferowany z następujących powodów:
źródło
Błędy kwadratowe w modelach liniowych są często preferowane z powodu:
Jednak zliczania jest niewrażliwa na skalowanie niezerowe. Pomnóż wektor przez stałą niezerową, liczba haseł niezerowych pozostanie taka sama. Zatem jest jednorodny na , podczas gdy wszystkie normy lub quasi-normy są jednorodne na poziomie . Nawet jeśli w jakiś sposób jako , ta rozbieżność wydaje mi się luką.ℓ0 0 ℓ p 1 ℓ p → ℓ 0 p → 0ℓ0 0 ℓp 1 ℓp→ℓ0 p→0
Tak więc, zgodnie z normami, niektórzy biorą pod uwagę (nie wypukłe) stosunki norm, takie jak , zobacz na przykład odniesienia w Euclid w Taxicab: Sparse Blind Deconvolution with Smoothed Regularization .ℓ 1 / ℓ 2ℓ1/ℓ2 ℓ1/ℓ2
źródło