Istnieje wiele metod przeprowadzania regularyzacji - na przykład regularyzacja oparta na normach , L 1 i L 2 . Według Friedmana Hastie & Tibsharani , najlepszy regulizator zależy od problemu: mianowicie charakteru prawdziwej funkcji celu, konkretnej zastosowanej podstawy, stosunku sygnału do szumu i wielkości próbki.
Czy istnieją badania empiryczne porównujące metody i skuteczność różnych metod regularyzacji?
r
regression
machine-learning
regularization
Ram Ahluwalia
źródło
źródło
Odpowiedzi:
Rozważmy karany model liniowy.
źródło
Kilka dodatków do odpowiedzi @Donbeo
1) Norma L0 nie jest normą w prawdziwym znaczeniu tego słowa. Jest to liczba niezerowych wpisów w wektorze. Norma ta wyraźnie nie jest normą wypukłą i nie jest normą w prawdziwym tego słowa znaczeniu. Dlatego możesz zobaczyć terminy takie jak „norma” L0. Staje się problemem kombinatorycznym i dlatego jest trudny do przeprowadzenia.
2) Norma L1 daje rzadkie rozwiązanie (spójrz na LASSO). Candes, Donoho itd. Przedstawiają przełomowe wyniki, które pokazują, że jeśli prawdziwe rozwiązanie jest naprawdę rzadkie, zastosowane metody L1 go odzyskają. Jeśli podstawowe rozwiązanie nie jest rzadkie, nie otrzymasz rozwiązania podstawowego w przypadkach, gdy p >> n. Są ładne wyniki, które pokazują, że Lasso jest spójny.
3) Istnieją metody, takie jak elastyczna siatka Zhou i Hastie, które łączą karane rozwiązania L2 i L1.
źródło