Nie jestem ekspertem od losowego lasu, ale doskonale rozumiem, że kluczowym problemem z losowym lasem jest (losowe) generowanie drzew. Czy możesz mi wyjaśnić, w jaki sposób generowane są drzewa? (tj. Jaka jest używana dystrybucja do generowania drzew?)
Z góry dziękuję !
machine-learning
r
algorithms
cart
random-forest
Robin Girard
źródło
źródło
Główną ideą jest procedura workowania, a nie losowanie drzew. Szczegółowo, każde drzewo jest zbudowane na próbce obiektów narysowanych zamiennie z oryginalnego zestawu; dlatego każde drzewo ma pewne obiekty, których nie widział, co sprawia, że cały zespół jest bardziej niejednorodny, a zatem lepszy w uogólnieniu.
Ponadto drzewa są osłabiane w taki sposób, że przy każdym podziale
mtry
brane są pod uwagę tylko M (lub ) losowo wybrane atrybuty; M jest zwykle pierwiastkiem kwadratowym z liczby atrybutów w zestawie. Dzięki temu drzewa są mniej obciążone, ponieważ nie są przycinane. Więcej informacji znajdziesz tutaj .Z drugiej strony istnieje wariant RF o nazwie Extreme Random Forest, w którym drzewa są tworzone w sposób losowy (nie ma optymalizacji podziałów) - skonsultuj, myślę, że to odniesienie .
źródło