Dlaczego w workowaniu wykorzystuje się próbki bootstrapu?

10

Bagging to proces tworzenia N uczniów na N różnych próbkach ładowania początkowego, a następnie uwzględnianie ich prognoz.

Moje pytanie brzmi: dlaczego nie zastosować innego rodzaju próbkowania? Dlaczego warto korzystać z próbek bootstrap?


źródło

Odpowiedzi:

9

Interesujące pytanie. Pasek startowy ma dobre właściwości próbkowania w porównaniu do niektórych alternatyw, takich jak scyzoryk. Główną wadą ładowania początkowego jest to, że każda iteracja musi pracować z próbką, która jest tak duża jak oryginalny zestaw danych (który może być kosztownie obliczeniowy), podczas gdy niektóre inne techniki próbkowania mogą działać z dużo mniejszymi próbkami.

Ten artykuł sugeruje, że naiwne zmniejszenie wielkości próbki może zmniejszyć wydajność w stosunku do workowania opartego na bootstrapie, co byłoby powodem, aby tego nie robić. W pracy przedstawiono także nowatorską metodę stosowania mniejszych próbek w oszacowaniach workowych, unikając tych problemów.

David J. Harris
źródło