Wykreślenie szacunkowych stoków, jak w pytaniu, jest świetną rzeczą do zrobienia. Zamiast filtrować według istotności - lub w połączeniu z nim - dlaczego nie zmapować jakiejś miary tego, jak dobrze każda regresja pasuje do danych? W tym celu średni błąd kwadratowy regresji jest łatwo interpretowany i znaczący.
Przykładowo R
poniższy kod generuje szereg czasowy 11 rastrów, wykonuje regresje i wyświetla wyniki na trzy sposoby: w dolnym rzędzie, jako osobne siatki szacowanych nachyleń i średnich błędów kwadratu; w górnym rzędzie, jako nakładka tych siatek wraz z prawdziwymi leżącymi pod nimi zboczami (których w praktyce nigdy nie będziesz mieć, ale dla porównania zapewnia to symulacja komputerowa). Nakładka, ponieważ używa koloru dla jednej zmiennej (szacowane nachylenie) i lekkości dla innej (MSE), nie jest łatwa do interpretacji w tym konkretnym przykładzie, ale wraz z oddzielnymi mapami w dolnym rzędzie może być użyteczna i interesująca.
(Proszę zignorować nakładające się legendy na nakładce. Należy również pamiętać, że schemat kolorów mapy „Prawdziwe stoki” nie jest taki sam, jak w przypadku map szacowanych stoków: błąd losowy powoduje, że niektóre szacowane stoki rozciągają się na bardziej ekstremalny zasięg niż prawdziwe zbocza. Jest to ogólne zjawisko związane z regresją w kierunku średniej .)
Przy okazji, nie jest to najskuteczniejszy sposób wykonywania dużej liczby regresji dla tego samego zestawu czasów: zamiast tego macierz projekcji można wstępnie obliczyć i zastosować do każdego „stosu” pikseli szybciej niż ponowne obliczenie dla każdej regresji. Ale to nie ma znaczenia dla tej małej ilustracji.
# Specify the extent in space and time.
#
n.row <- 60; n.col <- 100; n.time <- 11
#
# Generate data.
#
set.seed(17)
sd.err <- outer(1:n.row, 1:n.col, function(x,y) 5 * ((1/2 - y/n.col)^2 + (1/2 - x/n.row)^2))
e <- array(rnorm(n.row * n.col * n.time, sd=sd.err), dim=c(n.row, n.col, n.time))
beta.1 <- outer(1:n.row, 1:n.col, function(x,y) sin((x/n.row)^2 - (y/n.col)^3)*5) / n.time
beta.0 <- outer(1:n.row, 1:n.col, function(x,y) atan2(y, n.col-x))
times <- 1:n.time
y <- array(outer(as.vector(beta.1), times) + as.vector(beta.0),
dim=c(n.row, n.col, n.time)) + e
#
# Perform the regressions.
#
regress <- function(y) {
fit <- lm(y ~ times)
return(c(fit$coeff[2], summary(fit)$sigma))
}
system.time(b <- apply(y, c(1,2), regress))
#
# Plot the results.
#
library(raster)
plot.raster <- function(x, ...) plot(raster(x, xmx=n.col, ymx=n.row), ...)
par(mfrow=c(2,2))
plot.raster(b[1,,], main="Slopes with errors")
plot.raster(b[2,,], add=TRUE, alpha=.5, col=gray(255:0/256))
plot.raster(beta.1, main="True slopes")
plot.raster(b[1,,], main="Estimated slopes")
plot.raster(b[2,,], main="Mean squared errors", col=gray(255:0/256))