Dopasowuję regresję do . Czy poprawne jest obliczanie szacunkowych punktów przekształcenia (i przedziałów ufności / prognozowania) przez potęgowanie? Nie wierzę tak, ponieważ E [ f ( X ) ] ≠ f ( E [ X ] ), ale chciał opinii innych.
Mój przykład poniżej pokazuje konflikty z transformacją wsteczną (.239 vs .219).
set.seed(123)
a=-5
b=2
x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)
### NLS Fit
f <- function(x,a,b) {exp(a*x+b)}
fit <- nls(y ~ exp(a*x+b), start = c(a=-10, b=15))
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2)
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773
### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
fit lwr upr
1 0.2199471 0.1492762 0.3240752
regression
back-transformation
Dolina górska
źródło
źródło
Odpowiedzi:
To zależy od tego, co chcesz uzyskać na drugim końcu.
Przedział ufności dla przekształconego parametru transformuje się dobrze. Jeśli ma nominalne pokrycie w skali logarytmicznej, będzie miało to samo pokrycie z powrotem w pierwotnej skali, ze względu na monotoniczność transformacji.
Przedział przewidywania dla przyszłych obserwacji również dobrze się zmienia.
Przedział dla średniej na skali logarytmicznej zazwyczaj nie będzie odpowiednim przedziałem dla średniej na pierwotnej skali.
Czasami jednak można dokładnie lub w przybliżeniu uzyskać rozsądne oszacowanie średniej na oryginalnej skali z modelu na skali logarytmicznej.
Konieczna jest jednak ostrożność, w przeciwnym razie może dojść do sporządzenia oszacowań, które mają nieco zaskakujące właściwości (możliwe jest wytworzenie oszacowań, które same nie mają na przykład średniej populacyjnej; nie jest to pomysł każdego dobrego).
Zobacz tutaj .
Niektóre powiązane posty:
Wsteczna transformacja modelu MLR
Wsteczna transformacja
Odwrócone przedziały ufności
źródło