Właśnie przeczytałem artykuł, w którym autorzy przeprowadzili regresję wielokrotną z dwoma predyktorami. Ogólna wartość r-kwadrat wynosiła 0,65. Dostarczyły tabelę, która dzieli r-kwadrat między dwa predyktory. Stół wyglądał tak:
rsquared beta df pvalue
whole model 0.65 NA 2, 9 0.008
predictor 1 0.38 1.01 1, 10 0.002
predictor 2 0.27 0.65 1, 10 0.030
W tym modelu uruchomionym przy R
użyciu mtcars
zestawu danych całkowita wartość r-kwadrat wynosi 0,76.
summary(lm(mpg ~ drat + wt, mtcars))
Call:
lm(formula = mpg ~ drat + wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.4159 -2.0452 0.0136 1.7704 6.7466
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.290 7.318 4.139 0.000274 ***
drat 1.442 1.459 0.989 0.330854
wt -4.783 0.797 -6.001 1.59e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared: 0.7609, Adjusted R-squared: 0.7444
F-statistic: 46.14 on 2 and 29 DF, p-value: 9.761e-10
Jak mogę podzielić wartość r-kwadrat na dwie zmienne predykcyjne?
Odpowiedzi:
Możesz po prostu uzyskać dwie osobne korelacje i wyprostować je lub uruchomić dwa osobne modele i uzyskać R ^ 2. Zsumują się tylko wtedy, gdy predyktory są ortogonalne.
źródło
Oprócz odpowiedzi Johna możesz chcieć uzyskać kwadratowe korelacje częściowo cząstkowe dla każdego predyktora.
Jeśli szukasz funkcji R, jest
spcor()
wppcor
pakiecie.Możesz także rozważyć szerszy temat oceny znaczenia zmiennej w regresji wielokrotnej (np. Zobacz tę stronę o pakiecie relaimpo ).
źródło
Do twojego pytania dodałem tag dekompozycji wariancji . Oto część tagu wiki :
Jedną z powszechnych metod jest dodawanie regresorów do modelu jeden po drugim i rejestrowanie wzrostu miarę dodawania każdego regresora. Ponieważ wartość ta zależy od regresorów znajdujących się już w modelu, należy to zrobić dla każdej możliwej kolejności, w której regresory mogą wejść do modelu, a następnie uśrednić dla zamówień. Jest to wykonalne w przypadku małych modeli, ale staje się niemożliwe do obliczeń w przypadku dużych modeli, ponieważ liczba możliwych zamówień wynosi p ! dla predyktorów p .R2 p! p
Grömping (2007, The American Statistician ) przedstawia przegląd i wskazówki w literaturze w kontekście oceny zmiennego znaczenia.
źródło
y ~ a + b
y ~ b + a
y ~ a
y ~ a + b
y ~ b
y ~ a + b
y ~ b + a
a
a
b
y~1
y~a
b
y~b
y~a+b