Jak słyszałem o klasyfikatorze AdaBoost, o którym wielokrotnie wspominałem w pracy, chciałem lepiej zrozumieć, jak działa i kiedy można go użyć. Przeczytałem wiele artykułów i samouczków na ten temat, które znalazłem w Google, ale są pewne aspekty klasyfikatora, które wciąż nie mogę zrozumieć:
Większość samouczków, które widziałem, mówi o AdaBoost jako znalezieniu najlepszej ważonej kombinacji wielu klasyfikatorów. To ma dla mnie sens. To, co nie ma sensu, to wdrożenia (np. MALLET), w których AdaBoost wydaje się akceptować tylko jednego słabego ucznia. Jak to ma sens? Jeśli AdaBoost ma tylko jeden klasyfikator, czy nie powinien po prostu zwrócić tego samego klasyfikatora o wadze 1? Jak wytwarza nowe klasyfikatory od pierwszego klasyfikatora?
Kiedy ktoś chciałby korzystać z AdaBoost? Czytałem, że ma to być jeden z najlepszych gotowych klasyfikatorów, ale kiedy próbowałem podnieść klasyfikator MaxEnt, otrzymywałem wyniki F na poziomie 70% +, AdaBoost morduje go i daje mi f- wyniki około 15% przy bardzo wysokim przywołaniu i bardzo niskiej precyzji. Więc teraz jestem zdezorientowany. Kiedy chciałbym kiedykolwiek korzystać z AdaBoost? Jeśli to możliwe, szukam bardziej intuicyjnej, a nie ściśle statystycznej odpowiedzi.
źródło