Metody zestawów oparte na drzewach, takie jak Losowy Las, i kolejne pochodne (np. Las warunkowy), wszystkie wydają się być przydatne w tak zwanych problemach „małych n , dużych p ”, do identyfikacji względnej zmiennej ważności. Rzeczywiście wydaje się, że tak jest, ale moje pytanie brzmi, jak daleko można posunąć tę umiejętność? Czy można mieć, powiedzmy 30 obserwacji i 100 zmiennych? Jaki jest punkt krytyczny takiego podejścia i czy istnieją jakieś przyzwoite zasady, które istnieją? Wolę i zaakceptuję odpowiedzi poparte linkami do faktycznych dowodów (a nie przypuszczeń), przy użyciu symulowanych lub rzeczywistych zestawów danych. Nie znalazłem wiele na temat tego ostatniego ( tu i tutaj), więc Twoje uwagi / porady / (na temat) sugestie referencyjne są mile widziane!
źródło