Różnica między ep-SVR i nu-SVR (i SVR metodą najmniejszych kwadratów)

11

Próbuję dowiedzieć się, który SVR jest odpowiedni dla tego rodzaju danych.

Znam 4 typy SVR:

  • epsilon
  • nu
  • najmniejszych kwadratów i
  • liniowy.

Rozumiem, że liniowy SVR przypomina mniej więcej lasso z L1 Reg, ale jaka jest różnica między pozostałymi 3 technikami?

Sharath Chandra
źródło

Odpowiedzi:

11

W SVR parametr ν służy do określenia proporcji liczby wektorów pomocniczych, które chcesz zachować w swoim roztworze, w stosunku do całkowitej liczby próbek w zbiorze danych. W ν- SVR parametr ϵ jest wprowadzany do sformułowania problemu optymalizacji i jest dla ciebie automatycznie (optymalnie) szacowany.νννϵ

Jednak w -SVR nie masz kontroli nad tym, ile wektorów danych ze zbioru danych staje się wektorami pomocniczymi, może to być kilka, może być wiele. Niemniej jednak będziesz mieć całkowitą kontrolę nad tym, ile błędów pozwolisz na swój model, a wszystko poza określonym ϵ będzie karane proporcjonalnie do C , który jest parametrem regularyzacji.ϵϵC

W zależności od tego, czego chcę, wybieram między tymi dwoma. Jeśli naprawdę jestem zdesperowany, by znaleźć małe rozwiązanie (mniej wektorów pomocniczych), wybieram SVR i mam nadzieję uzyskać przyzwoity model. Ale jeśli naprawdę chcę kontrolować ilość błędów w moim modelu i wybrać najlepszą wydajność, wybieram ϵ -SVR i mam nadzieję, że model nie jest zbyt skomplikowany (wiele wektorów pomocniczych).νϵ

Pablo Rivas
źródło
5

ϵννν

Najmniejsze kwadraty SVR różnią się od pozostałych dwóch poprzez użycie kwadratowych reszt w funkcji kosztu zamiast utraty zawiasu.

ν

Marc Claesen
źródło
Dziękuję za odpowiedź Marc. Czy możemy zatem wyróżnić odpowiednią metodę na podstawie posiadanego zestawu danych? Jeśli tak, czy możesz podać mi wskazówki? Mam 40000 próbek o 200 różnych wynikach. Można więc uznać to za 200 zestawów 200 unikalnych próbek. Dane wejściowe dla wszystkich 40000 są różne, tylko dane wyjściowe są unikalne dla 200 próbek.
Sharath Chandra
0

Lubię zarówno odpowiedzi Pabla, jak i Marca. Jeden dodatkowy punkt:

W artykule cytowanym przez Marca jest napisane (sekcja 4)

νϵϵϵy

[...]

ϵyϵ[1,+1]ϵ[0,1]νϵ

ϵϵν

Co myślisz?

spec3
źródło