Czy podczas korzystania z maszyny wektorów pomocniczych istnieją jakieś wytyczne dotyczące wyboru jądra liniowego vs. jądra nieliniowego, takiego jak RBF? Kiedyś słyszałem, że nieliniowe jądro nie działa dobrze, gdy liczba funkcji jest duża. Czy są jakieś odniesienia w tej sprawie?
machine-learning
classification
svm
references
kernel-trick
użytkownik3269
źródło
źródło
Odpowiedzi:
Zwykle decyduje się, czy użyć jądra liniowego czy RBF (aka Gaussa). Należy wziąć pod uwagę dwa główne czynniki:
Wykazano, że jądro liniowe jest zdegenerowaną wersją RBF , dlatego jądro liniowe nigdy nie jest bardziej dokładne niż odpowiednio dostrojone jądro RBF. Cytując streszczenie z artykułu, który połączyłem:
Podstawową praktyczną zasadę pokrótce opisano w praktycznym przewodniku NTU dotyczącym wspierania klasyfikacji wektorów (załącznik C).
Twój wniosek jest mniej więcej słuszny, ale masz argument w odwrotnej kolejności. W praktyce, liniowe jądro ma tendencję do działania bardzo dobrze, gdy liczba elementów jest duża (np. Nie ma potrzeby mapowania do jeszcze większej przestrzeni wymiarów elementów). Typowym tego przykładem jest klasyfikacja dokumentów z tysiącami wymiarów w przestrzeni wejściowej.
W takich przypadkach jądra nieliniowe niekoniecznie są znacznie bardziej dokładne niż liniowe. Zasadniczo oznacza to, że jądra nieliniowe tracą na atrakcyjności: wymagają dużo więcej zasobów, aby trenować z niewielką lub żadną korzyścią w zakresie wydajności predykcyjnej, więc po co to robić.
TL; DR
Zawsze najpierw wypróbuj liniowy, ponieważ trenowanie jest znacznie szybsze (ORAZ test). Jeśli dokładność jest wystarczająca, poklep się po plecach za dobrze wykonaną robotę i przejdź do następnego problemu. Jeśli nie, spróbuj nieliniowego jądra.
źródło
Andrew Ng podaje miłą, praktyczną objaśnienie w tym filmie od 14:46, chociaż cały film jest wart obejrzenia.
Kluczowe punkty
źródło