Chciałbym utworzyć losowy las przy użyciu następującego procesu:
- Zbuduj drzewo na losowych próbkach danych i funkcji, używając przyrostu informacji do określania podziałów
- Zakończ węzeł liścia, jeśli przekracza on z góry określoną głębokość LUB jakiekolwiek rozszczepienie spowodowałoby, że liczba liści byłaby mniejsza niż z góry określone minimum
- Zamiast przypisywać etykietę klasy do każdego drzewa, przypisz proporcję klas w węźle liścia
- Przestań budować drzewa po zbudowaniu z góry określonej liczby
Spowoduje to tradycyjny tradycyjny losowy proces leśny na dwa sposoby. Po pierwsze, wykorzystuje przycięte drzewa, które przypisują proporcje, a nie etykiety klas. Po drugie, kryterium zatrzymania jest z góry określona liczba drzew, a nie niektóre szacunki błędu braku w torbie.
Moje pytanie brzmi:
Czy w przypadku powyższego procesu, który generuje drzewa N, mogę dopasować model przy użyciu regresji logistycznej z wyborem LASSO? Czy ktoś ma doświadczenie w dopasowywaniu klasyfikatora „Losowy las” i obróbce końcowej do logistycznego systemu LASSO?
Struktura ISLE wspomina o użyciu LASSO jako kroku przetwarzania końcowego problemów regresji, ale nie problemów klasyfikacji. Co więcej, nie otrzymuję żadnych pomocnych wyników, kiedy googlujesz „Losowe lasso leśne”.
źródło
Odpowiedzi:
Brzmi to trochę jak wzmocnienie drzewa gradientowego. Ideą wzmocnienia jest znalezienie najlepszego liniowego połączenia klasy modeli. Jeśli dopasujemy drzewo do danych, staramy się znaleźć drzewo, które najlepiej wyjaśnia zmienną wynikową. Jeśli zamiast tego użyjemy wzmocnienia, staramy się znaleźć najlepszą liniową kombinację drzew.
Jednak dzięki wzmocnieniu jesteśmy trochę bardziej wydajni, ponieważ nie mamy kolekcji losowych drzew, ale staramy się budować nowe drzewa, które działają na przykładach, których nie możemy jeszcze dobrze przewidzieć.
Aby uzyskać więcej informacji na ten temat, sugeruję przeczytanie rozdziału 10 elementów statystycznego uczenia się: http://statweb.stanford.edu/~tibs/ElemStatLearn/
Chociaż nie jest to pełna odpowiedź na twoje pytanie, mam nadzieję, że to pomoże.
źródło