Pytania oznaczone «resampling»

Ponowne próbkowanie polega na pobraniu próbki z próbki. Typowe zastosowania to zbieranie próbek (przyjmowanie podpróbki, np. Wszystkie wartości oprócz 1) i ładowanie początkowe (pobieranie próbek z wymianą). Techniki te mogą zapewnić solidne oszacowanie rozkładu próbkowania, gdy jego wyprowadzenie analityczne byłoby trudne lub niemożliwe.

73
Metody ponownego próbkowania / symulacji: monte carlo, bootstrapping, jackknifing, cross-validation, testy randomizacji i testy permutacji

Próbuję zrozumieć różnicę między różnymi metodami ponownego próbkowania (symulacja Monte Carlo, ładowanie parametryczne, ładowanie nieparametryczne, podnoszenie, walidacja krzyżowa, testy randomizacji i testy permutacji) i ich implementacja w moim kontekście przy użyciu R. Powiedzmy, że mam...

20
Metody ponownego próbkowania Careta

Korzystam z biblioteki caretw języku R do testowania różnych procedur modelowania. trainControlObiektu pozwala na określenie metody wielokrotnego pobierania próbek. Te sposoby są opisane w dokumentacji części 2.3 i obejmują: boot, boot632, cv, LOOCV, LGOCV, repeatedcvi oob. Chociaż niektóre z nich...

12
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace =...