Jakie są normy i jakie mają znaczenie dla regularyzacji?

12

Ostatnio widziałem wiele artykułów na temat rzadkich reprezentacji, a większość z nich używa normy i dokonuje pewnych minimalizacji. Moje pytanie brzmi: co to jest norma , a norma ? A w jaki sposób mają one znaczenie dla regularyzacji?pppp,q

Dzięki

woda
źródło

Odpowiedzi:

13

p p = 2

xp=(i=1d|xi|p)1/p
p=2 p = x = sup i x i max i x i p xpxy2p=x=supiximaxixipxpxp0<p<1xp

(Istnieją również normy , które są definiowane analitycznie, z wyjątkiem funkcji zamiast wektorów lub sekwencji - tak naprawdę to samo, ponieważ wektory są funkcjami o domenach skończonych).Lp

Nie znam żadnego zastosowania normy w aplikacji do uczenia maszynowego, gdzie , z wyjątkiem sytuacji, gdy . Zwykle widzisz lub , lub czasami gdzie chcesz złagodzić przypadek ; nie jest ściśle wypukły w , alep = p = 2 p = 1 1 < p < 2 p = 1 x1 xxpp>2p=p=2p=11<p<2p=1x1xxp jest dla . W niektórych przypadkach może to ułatwić znalezienie rozwiązania.1<p<

W kontekście regulacji, jeśli dodasz do funkcji celu, mówisz, że oczekujesz, że będzie rzadki , to znaczy składa się głównie z zer. To trochę techniczne, ale w zasadzie, jeśli istniejexx1x gęste rozwiązanie, prawdopodobnie istnieje rzadsze rozwiązanie z tą samą normą. Jeśli oczekujesz, że twoje rozwiązanie będzie gęste, możesz dodać do celu, ponieważ wtedy znacznie łatwiej jest pracować z jego pochodną. Oba służą do tego, aby rozwiązanie nie miało zbyt dużej wagi.x22

Mieszana norma pojawia się, gdy próbujesz zintegrować kilka źródeł. Zasadniczo chcesz, aby wektor rozwiązania składał się z kilku elementów , gdzie jest indeksem jakiegoś źródła. normą jest po prostu -norm wszystkichxjjp,qqp -norms zbiera się w wektorze. Tj.

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

Celem tego nie jest „nadmierne sparsowanie” zestawu rozwiązań, powiedzmy za pomocą . Poszczególne elementy są rzadkie, ale nie ryzykujesz, że nukniesz cały wektor rozwiązania, biorącx1,21 normę ze wszystkich rozwiązań. Zamiast tego używasz norm na zewnątrz.2

Mam nadzieję, że to pomaga.

Zobacz ten artykuł, aby uzyskać więcej informacji.

Josephine Moeller
źródło
1
+1 za wyjaśnienie norm mieszanych. Sam ich nigdy nie zrozumiałem.
Suresh Venkatasubramanian
(+1) Ładna odpowiedź. Witamy w CrossValidated, John!
MånsT