Metody ponownego próbkowania Careta

20

Korzystam z biblioteki caretw języku R do testowania różnych procedur modelowania.

trainControlObiektu pozwala na określenie metody wielokrotnego pobierania próbek. Te sposoby są opisane w dokumentacji części 2.3 i obejmują: boot, boot632, cv, LOOCV, LGOCV, repeatedcvi oob. Chociaż niektóre z nich można łatwo wywnioskować, nie wszystkie z tych metod są jasno określone.

Jakie są procedury odpowiadające tym metodom ponownego próbkowania?

Ram Ahluwalia
źródło
link do dokumentacji jest uszkodzony. Zamiast tego użyj tego .
vikas,

Odpowiedzi:

20

Ok, oto moja próba:

mpiktas
źródło
1
Uważam, że LGOCV losowo dzieli się między zestawem treningowym a zestawem walidacyjnym, powtarzane n razy. Tak więc zamiast zwykłego przypadku dzielenia danych między pociągiem a blokadą (zbuduj model w pociągu i zweryfikuj blokadę) jeden raz, proces ten powtarza się wiele razy.
B_Miner
3
Uważam również, że powtarzane CV to k-krotna walidacja krzyżowa, wykonywana wiele razy.
B_Miner
Trudno uwierzyć, że nie jest to gdzieś udokumentowane.
andrew
4

Na repeatedcvpewno powtarza się 10-krotną walidację krzyżową, zgodnie z prezentacją Maxa Kuhna. Domyślny schemat ponownego próbkowania to bootstrap.

Dobrym plikiem, na który możesz spojrzeć o metodach ponownego próbkowania, jest Modelowanie predykcyjne z R i pakietem karetki ( pdf ). Max przedstawił to w „useR! 2013”.

tigergopro
źródło