Jestem ciekawy stwierdzenia dokonanego na dole pierwszej strony tego tekstu dotyczącego korekty
Tekst stanowi:
Logika korekty jest następująca: w zwykłej regresji wielokrotnej predyktor losowy wyjaśnia średnio proporcję zmiany odpowiedzi, tak że losowych predyktorów wyjaśnia razem, średnio wariantu odpowiedzi; innymi słowy, oczekiwana wartość to . Zastosowanie formuły [ ] do tej wartości, gdzie wszystkie predyktory są losowe, daje ”.
Wydaje się, że jest to bardzo prosta i możliwa do interpretacji motywacja dla . Jednak nie udało mi się ustalić, że dla pojedynczego losowego (tj. Nieskorelowanego) predyktora.
Czy ktoś może skierować mnie tutaj we właściwym kierunku?
regression
expected-value
goodness-of-fit
r-squared
gregory_britten
źródło
źródło
Odpowiedzi:
To są dokładne statystyki matematyczne. Zobacz ten post dla wyprowadzenia rozkładu pod hipotezą, że wszystkie regresory (za wyjątkiem stałej stałej) są nieskorelowane ze zmienną zależną („predyktory losowe”).R2
Ten rozkład to Beta, gdzie jest liczbą predyktorów bez zliczania stałego składnika, a wielkości próby,m n
a więc
Wydaje się to sprytnym sposobem na „uzasadnienie” logiki skorygowanego : jeśli rzeczywiście wszystkie regresory są nieskorelowane, wówczas skorygowane wynosi „średnio” zero.R2 R2
źródło