Rozumiem teoretycznie (w pewnym sensie), jak by one działały, ale nie jestem pewien, jak właściwie korzystać z metody złożonej (takiej jak głosowanie, ważone mieszanki itp.).
- Jakie są dobre zasoby do wdrażania metod zespołowych?
- Czy są jakieś szczególne zasoby dotyczące implementacji w Pythonie?
EDYTOWAĆ:
Aby wyjaśnić niektóre na podstawie dyskusji na temat komentarzy, nie szukam algorytmów złożonych, takich jak randomForest itp. Zamiast tego zastanawiam się, jak połączyć różne klasyfikacje z różnych algorytmów.
Załóżmy na przykład, że ktoś używa regresji logistycznej, SVM i niektórych innych metod do przewidywania klasy określonej obserwacji. Jaki jest najlepszy sposób na uzyskanie najlepszego oszacowania klasy na podstawie tych prognoz?
źródło
„Metody zestawów w eksploracji danych: poprawa dokładności poprzez łączenie prognoz”, Seni i Elder - Doskonałe odniesienie do praktycznej teorii i implementacji zestawu, ale towarzyszący kod jest oparty na R.
„Uczenie maszynowe: perspektywa algorytmiczna”, S. Marsland - Doskonały praktyczny tekst oparty na języku Python, ale nie tak poświęcony czystym zespołom, jak pierwsze odniesienie.
źródło
Odpowiedź Stumpy'ego Joe Pete'a była doskonała, ale skoro wspomniałeś o implementacji Pythona, chciałem wspomnieć o projekcie piwa z Universidade Federal de Pernambuco.
https://github.com/viisar/brew
W tym momencie mają generowanie zespołu, kombinację, przycinanie i dynamiczny wybór.
Ograniczenia: tylko klasyfikacja; brak stosów w aktualnej wersji publicznej; niewiele dokumentacji.
źródło
Salford Systems ma pakiet oprogramowania o nazwie Random Forests, który implementuje to do zestawów drzewek klasyfikacji i regresji. Nie mam żadnych bezpłatnych pakietów R. Wyobrażam sobie, że mają instrukcję obsługi, która wyjaśni ich wdrożenie. Przez analogię prawdopodobnie możesz dowiedzieć się, jak to zrobić dla innych metod łączenia.
źródło
Ten samouczek okazał się niezwykle pomocny. Nie odpowiada na wszystkie pytania, ale myślę, że to dobry początek dyskusji: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
źródło
Scikit-learn ensembling przewodnik zapewnia pakowanie w woreczki i pobudzanie meta-klasyfikatorów i regresorów. Ponadto biblioteka mlxtend zapewnia implementacje układania meta-klasyfikatorów i regresorów.
źródło