Kiedy używałem bootstrapowania do oceny modelu, zawsze myślałem, że próbki z torebki były bezpośrednio używane jako zestaw testowy. Jednak wydaje się, że nie jest tak w przypadku przestarzałego podejścia scikit-learnBootstrap
, które wydaje się budować zestaw testowy na podstawie rysowania z zastępowaniem z podzbioru danych poza torbą. Jakie jest uzasadnienie statystyczne? Czy istnieją konkretne scenariusze, w których ta technika jest lepsza niż tylko ocena próbki po wyjęciu z torby lub odwrotnie?
15
Odpowiedzi:
Próbki bootstrap są używane do oceny wydajności algorytmu przez wiele iteracji. W ten sposób oceniana jest wydajność losowo zmienianych zestawów.
W przeciwieństwie do tego, wykonując na przykład 10-krotną weryfikację krzyżową, wykonuje się tylko 10 iteracji na różnych zestawach danych pociągu i testu.
Link, który publikujesz, jest wyłączony, więc dodałem opis funkcji w bieżącej (0.14) wersji sklearn
Opis metody
źródło
Być może coś ci się podobało. Wygląda na to, że inni pociągnęli za ten sam wątek i
Bootstrap
został wycofany na korzyść bardziej celowego użycia tejresample
metody przy użyciu takich wypróbowanych i prawdziwychsklearn.cross_validation
metodStratifiedKFold
.źródło