Muszę podzielić adresy URL na kategorie. Powiedzmy, że mam 15 kategorii, do których planuję wyzerować każdy adres URL.
Czy 15-drożny klasyfikator jest lepszy? Gdzie mam 15 etykiet i generuję funkcje dla każdego punktu danych.
Lub budowanie 15 binarnych klasyfikatorów, powiedzmy: film lub nie-film, i użyj liczb, które otrzymuję z tych klasyfikacji, aby zbudować ranking, wybrać najlepszą kategorię, czy będzie lepiej?
Będzie to zależeć od sposobu rozproszenia danych. Jest piękny przykład, który został niedawno podany do podobnego pytania, w którym OP chciał wiedzieć, czy pojedyncza liniowa funkcja dyskryminacyjna byłaby lepszym klasyfikatorem do decydowania o populacji A względem B lub C, czy też ta oparta na wielu liniowych funkcjach dyskryminujących, które oddzielają A, B i C. Ktoś dał bardzo ładny kolorowy wykres rozrzutu, aby pokazać, jak użycie dwóch dyskryminatorów byłoby lepsze niż jeden w tym przypadku. Spróbuję link do tego.
źródło
Niektóre metody radzą sobie dobrze na przykład z wieloklasowymi, losowymi lasami i MLP.
Jeśli nie chcesz iść w tym kierunku, możliwe, że ESK może wykonać 1-vs-All dla twojego problemu, tylko testy pokażą.
źródło