Próbkowanie MCMC przestrzeni drzewa decyzyjnego vs. losowy las

11

Losowy las jest zbiorem drzew decyzyjnych tworzonych przez losowo wybierając tylko niektóre funkcje, aby zbudować każde drzewo z (a czasem pakowania danych treningowych). Najwyraźniej dobrze się uczą i generalizują. Czy ktoś zrobił MCMC próbkowanie przestrzeni drzewa decyzyjnego lub porównał je z losowymi lasami? Wiem, że uruchomienie MCMC i zapisanie wszystkich próbkowanych drzew może być droższe obliczeniowo, ale interesują mnie teoretyczne cechy tego modelu, a nie koszty obliczeniowe. Mam na myśli coś takiego:

  1. Skonstruuj losowe drzewo decyzyjne (prawdopodobnie działałoby okropnie)
  2. Oblicz prawdopodobieństwo drzewa za pomocą czegoś takiego jak , lub może dodaj termin .P p r i o r ( T r e e )P(Tree|Data)P(Data|Tree)Pprior(Tree)
  3. Wybierz losowy krok, aby zmienić drzewo i wybierz na podstawie prawdopodobieństwa .P(Tree|Data)
  4. Co N kroków, zapisz kopię bieżącego drzewa
  5. Wróć do 3 dla niektórych dużych N * M razy
  6. Skorzystaj z kolekcji M zapisanych drzew, aby dokonać prognoz

Czy to dałoby wyniki podobne do losowych lasów? Pamiętaj, że tutaj nie wyrzucamy dobrych danych ani funkcji na żadnym etapie, w przeciwieństwie do losowych lasów.

wysoka przepustowość
źródło
2
Nie jestem pewien, czy jest to dokładnie taka procedura, którą szkicujesz, ale istnieje BART . Oto link do pliku PDF
joran

Odpowiedzi:

4

Niestety Chipman i in. w ich bayesowskim podejściu CART wyodrębnia tylko najbardziej prawdopodobne drzewo. Nigdy nie próbowali uśredniać liczby drzew i porównywać wydajności do losowego lasu i dodatkowych drzew.

Właśnie przeczytałem artykuł BART od Chipmana. Jeśli dobrze rozumiem, jest to bayesowskie uśrednianie próbek K w zbiorze m drzewa. Jest interesujący na wiele sposobów i wydaje się, że działa naprawdę dobrze. Gdy m = „1”, jest to proste uśrednianie bayesowskie próbek K z 1 drzewa, pochodzących z tyłu. Nie przeprowadzono jednak wielu testów tego konkretnego aspektu. I nadal chciałbym wiedzieć, w jaki sposób Random Forest lub Extra-Trees porównuje się do prawdziwego modelu Bayesa.

Alex
źródło