Niemal każdy przykład drzewa decyzyjnego, z którym się zetknąłem, jest drzewem binarnym. Czy to jest dość uniwersalne? Czy większość standardowych algorytmów (C4.5, CART itp.) Obsługuje tylko drzewa binarne? Z tego, co zbieram, CHAID nie ogranicza się do drzew binarnych, ale wydaje się, że jest to wyjątek.
Dwukierunkowy podział, po którym następuje kolejny dwukierunkowy podział na jedno z dzieci, nie jest tym samym, co pojedynczy trójstronny podział. To może być punkt akademicki, ale staram się upewnić, że rozumiem najczęstsze przypadki użycia.
źródło
Nie jestem pewien, co masz na myśli. Dowolny podział wielokrotny może być reprezentowany jako seria podziałów dwukierunkowych. W przypadku podziału trójstronnego możesz podzielić na A, B i C, najpierw dzieląc na A&B w porównaniu do C, a następnie dzieląc A z B.
Dany algorytm może nie wybrać tej konkretnej sekwencji (zwłaszcza jeśli, jak większość algorytmów, jest zachłanny), ale z pewnością mógłby. A jeśli jakakolwiek procedura randomizacji lub stagewise zostanie wykonana jak w przypadkowych lasach lub drzewach wzmocnionych, szanse na znalezienie właściwej sekwencji podziałów wzrosną. Jak zauważyli inni, podziały w wielu kierunkach są kosztowne obliczeniowo, więc biorąc pod uwagę te alternatywy, większość badaczy wydaje się wybierać podziały binarne.
Mam nadzieję że to pomoże
źródło
Jeśli chodzi o wykorzystanie drzewa decyzyjnego i dzielenia (binarne kontra inne), znam tylko CHAID, który ma podziały niebinarne, ale prawdopodobnie są inne. Dla mnie głównym zastosowaniem podziału niebinarnego jest ćwiczenie eksploracji danych, w którym szukam sposobu optymalnego binowania zmiennej nominalnej z wieloma poziomami. Seria podziałów binarnych nie jest tak przydatna jak grupowanie wykonane przez CHAID.
źródło
Przeczytaj to
źródło