Czy ktoś może pomóc w wyjaśnieniu pojęciowym, w jaki sposób tworzone są prognozy dla nowych danych, gdy stosuje się wygładzanie / splajny dla modelu predykcyjnego? Na przykład, biorąc pod uwagę model stworzony przy użyciu gamboost
w mboost
opakowaniu w R, p-splajnów, jak są prognozy dla nowych danych? Czego używa dane szkoleniowe?
Powiedzmy, że istnieje nowa wartość zmiennej niezależnej x i chcemy przewidzieć y. Czy formuła tworzenia splajnu jest stosowana do tej nowej wartości danych przy użyciu węzłów lub df używanych podczas uczenia modelu, a następnie współczynniki z wyuczonego modelu są stosowane do uzyskania prognozy?
Oto przykład z R, co według przewidywań robi koncepcyjnie na wynik 899,4139 dla nowych danych średnia wartość = 15,99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)
Odpowiedzi:
Sposób obliczania prognozy jest następujący:
mean_radius
mboost
mboost
bbs(rnorm(100))$dpp(rep(1,100))$predict
,i stamtąd odkrywaj. Na przykład,
with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), newX)
połączenia
with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), Xfun)
źródło