Wydaje mi się, że rozumiem, jak działają podstawy ładowania początkowego , ale nie jestem pewien, czy rozumiem, jak mogę użyć ładowania początkowego do wyboru modelu lub uniknąć nadmiernego dopasowania.
Na przykład, aby wybrać model, czy po prostu wybierzesz model, który daje najniższy błąd (może wariancję?) We wszystkich próbkach ładowania początkowego?
Czy są jakieś teksty, które dyskutują o tym, jak używać ładowania początkowego do wyboru lub weryfikacji modelu?
EDYCJA: Zobacz ten wątek i odpowiedź @ mark999, aby uzyskać więcej kontekstu za tym pytaniem.
model-selection
cross-validation
bootstrap
Amelio Vazquez-Reina
źródło
źródło
Odpowiedzi:
Najpierw musisz zdecydować, czy naprawdę potrzebujesz wyboru modelu, czy po prostu musisz modelować. W większości sytuacji, w zależności od wymiarów, preferowane jest dopasowanie elastycznego modelu kompleksowego.
Bootstrap to świetny sposób na oszacowanie wydajności modelu. Najprostszą rzeczą do oszacowania jest wariancja. Bardziej do twojego pierwotnego punktu, bootstrap może oszacować prawdopodobną przyszłą wydajność danej procedury modelowania na nowych danych, które nie zostały jeszcze zrealizowane.
Jeśli używasz resampling (bootstrap lub walidacji krzyżowej), aby wybrać parametry dostrajania modelu i oszacować model, będziesz potrzebował podwójnego bootstrapu lub zagnieżdżonej weryfikacji krzyżowej.
Zasadniczo bootstrap wymaga mniej dopasowania modelu (często około 300) niż walidacja krzyżowa (10-krotna walidacja krzyżowa powinna zostać powtórzona 50-100 razy dla stabilności).
Niektóre badania symulacyjne można znaleźć na stronie http://biostat.mc.vanderbilt.edu/rms
źródło
Rozważ użycie bootstrap do uśrednienia modelu .
Poniższy artykuł może pomóc, ponieważ porównuje podejście do uśredniania modelu bootstrap z (częściej stosowanym?) Uśrednianiem modelowania bayesowskiego i przedstawia przepis na wykonanie uśredniania modelu.
Uśrednianie modelu bootstrap w badaniach szeregów czasowych zanieczyszczenia powietrza i śmiertelności cząstek stałych
źródło