Statystyki i duże zbiory danych

13
Pakiet GBM vs. Caret korzystający z GBM

Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę...

13
Dlaczego warto studiować regresję liniową?

Biorąc pod uwagę dwie zmienne losowe i \ eta , możemy obliczyć ich „współczynnik korelacji” c i utworzyć linię najlepszego dopasowania między tymi dwiema zmiennymi losowymi. Moje pytanie brzmi: dlaczego?η cξξ\xiηη\etadocc 1) Istnieją zmienne losowe, ξξ\xi i ηη\eta które są zależne w najgorszy...

13
Robiąc MCMC: użyj jags / stan lub sam go zaimplementuj

Jestem nowy w badaniach Bayesian Statistics. Słyszałem od badaczy, że badacze bayesowscy lepiej wdrażają MCMC samodzielnie, niż używając narzędzi takich jak JAGS / Stan. Czy mogę zapytać, jaka jest korzyść z samodzielnego wdrażania algorytmu MCMC (w „niezbyt szybkich” językach, takich jak R), z...

13
Dlaczego

Na tej stronie głównej AP Zmienne losowe a zmienne algebraiczne autor Peter Flanagan-Hyde rozróżnia zmienne algebraiczne i losowe. Po części mówi , ale X + X ≠ 2 Xx + x = 2 xx+x=2xx + x = 2xX+ X≠ 2 XX+X≠2XX + X \neq 2X - w rzeczywistości jest to podtytuł artykułu. Jaka jest podstawowa...