O ile widziałem, opinie na ten temat różnią się. Najlepsza praktyka z pewnością podyktowałaby zastosowanie weryfikacji krzyżowej (szczególnie przy porównywaniu RF z innymi algorytmami w tym samym zbiorze danych). Z drugiej strony oryginalne źródło stwierdza, że fakt błędu OOB obliczanego podczas szkolenia modelu jest wystarczającym wskaźnikiem wydajności zestawu testowego. Nawet Trevor Hastie w stosunkowo niedawnych rozmowach mówi, że „Losowe lasy zapewniają bezpłatną weryfikację krzyżową”. Intuicyjnie ma to dla mnie sens, jeśli trenuję i próbuję ulepszyć model oparty na RF na jednym zbiorze danych.
Jakie jest twoje zdanie na ten temat?
Odpowiedzi:
Jak wskazuje @Wouter, prawdopodobnie będziesz chciał przeprowadzić walidację krzyżową w celu dostrajania parametrów, ale jako oszacowanie błędu zestawu testowego błąd OOB powinien być w porządku.
źródło