Sytuacja
Mam zestaw danych z jednym zależnym i jedna zmienna niezależna . Chcę dopasować do ciągłej częściowej regresji liniowej znane / ustalone punkty przerwania występujące w . Breakpoins są znane bez wątpliwości, więc nie chcę ich szacować. Następnie dopasowuję regresję (OLS) formularza
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Załóżmy, że punkt przerwania występuje o :
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Punkt przecięcia i nachylenie dwóch segmentów to: i po raz pierwszy i i odpowiednio dla drugiego.
pytania
- Jak łatwo obliczyć przecięcie i nachylenie każdego segmentu? Czy model można ponownie sparametryzować, aby zrobić to w jednym obliczeniu?
- Jak obliczyć błąd standardowy każdego nachylenia każdego segmentu?
- Jak sprawdzić, czy dwa sąsiednie zbocza mają takie same zbocza (tj. Czy punkt przerwania można pominąć)?
źródło
x
iI(pmax(x-9.6,0))
czy to prawda?Moje naiwne podejście, które odpowiada na pytanie 1:
Ale nie jestem pewien, czy statystyki (w szczególności stopnie swobody) są wykonywane poprawnie, jeśli zrobisz to w ten sposób.
źródło