http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Jeśli spojrzysz na górę tego postu, pisarz wspomina, że norma L2 ma unikalne rozwiązanie, a norma L1 ma prawdopodobnie wiele rozwiązań. Rozumiem to w kategoriach regularyzacji, ale nie w kategoriach użycia normy L1 lub normy L2 w funkcji straty.
Jeśli spojrzysz na wykresy funkcji skalarnej x (x ^ 2 i | x |), możesz łatwo zauważyć, że oba mają jedno unikalne rozwiązanie.
regression
lasso
regularization
użytkownik3180
źródło
źródło
Odpowiedzi:
Rozważmy jednowymiarowy problem dla najprostszej możliwej ekspozycji. (Przypadki o wyższych wymiarach mają podobne właściwości).
Ponieważ (poza pewnymi szczególnymi okolicznościami) zwykle nie masz żadnej takiej gwarancji braku bardzo wpływowych obserwacji, nie nazwałbym regresją L1 solidną.
Kod R dla wykresu:
źródło
plot
. Umysł jest wysadzony w powietrze.Minimalizacja straty L2 odpowiada obliczeniu średniej arytmetycznej, co jest jednoznaczne, natomiast minimalizacja straty L1 odpowiada obliczeniu mediany, która jest niejednoznaczna, jeśli w obliczeniu mediany uwzględniona jest parzysta liczba elementów (patrz Tendencja centralna: Rozwiązania problemów wariacyjnych ).
źródło