Jakie są cechy szczególne lub właściwości wskazujące, że pewien problem uczenia się można rozwiązać za pomocą maszyn wektorów wsparcia?
Innymi słowy, co jest takiego, że gdy widzisz problem z nauką, sprawiasz, że mówisz „och, zdecydowanie powinienem używać do tego SVM” niż sieci neuronowe lub drzewa decyzyjne czy cokolwiek innego?
supervised learning
tag, ponieważ SVM może być również wykorzystywany w problemach z uczeniem się bez nadzoru .exception
, masz na myśli, że to tylko drobna poprawka, a nie konwencja, prawda?Odpowiedzi:
SVM można wykorzystać do klasyfikacji (rozróżnienia między kilkoma grupami lub klasami) i regresji (uzyskanie modelu matematycznego do przewidywania czegoś). Można je stosować zarówno do problemów liniowych, jak i nieliniowych.
Do 2006 r. Były najlepszym algorytmem ogólnego przeznaczenia do uczenia maszynowego. Próbowałem znaleźć artykuł, w którym porównano wiele implementacji najbardziej znanych algorytmów: svm, sieci neuronowe, drzewa itp. Nie mogłem tego żałować (musisz mi uwierzyć, coś złego). W artykule algorytmem, który uzyskał najlepszą wydajność, był svm z biblioteką libsvm.
W 2006 r. Hinton opracował metodę głębokiego uczenia się i sieci neuronowych. Poprawił obecny stan techniki o co najmniej 30%, co stanowi ogromny postęp. Jednak głębokie uczenie się osiąga dobre wyniki tylko w przypadku dużych zestawów treningowych. Jeśli masz mały zestaw treningowy, sugerowałbym użycie svm.
Ponadto znajdziesz tutaj przydatną infografikę o tym, kiedy używać różnych algorytmów uczenia maszynowego przez scikit-learn. Jednak, zgodnie z moją najlepszą wiedzą, społeczność naukowa nie zgadza się co do tego, czy problem ma funkcje X, Y i Z, lepiej więc użyć svm. Sugerowałbym wypróbowanie różnych metod. Nie zapominaj też, że svm lub sieci neuronowe to tylko metoda obliczenia modelu. Bardzo ważne jest także to, jakich funkcji używasz.
źródło
Załóżmy, że jesteśmy w klasyfikacji.
Dla
svm
inżynierii cechą jest podstawą:svm
wydajność cierpi, ponieważ zwiększamy liczbę wymiarów szybciej niż inne metodologie (zespół drzew). Wynika to z ograniczonego problemu optymalizacji, który popierasvm
s. Czasami redukcja funkcji jest możliwa, a czasem nie, i wtedy nie możemy naprawdę utorować drogi dla efektywnego wykorzystaniasvm
svm
prawdopodobnie będzie miał problemy z zestawem danych, w którym liczba funkcji jest znacznie większa niż liczba obserwacji. To znowu można zrozumieć, patrząc na ograniczony problem optymalizacyjny.svm
algorytm.źródło