Oczekiwana wartość , współczynnik determinacji, pod hipotezą zerową

12

Jestem ciekawy stwierdzenia dokonanego na dole pierwszej strony tego tekstu dotyczącego korektyRadjusted2

Radjusted2=1(1R2)(n1nm1).

Tekst stanowi:

Logika korekty jest następująca: w zwykłej regresji wielokrotnej predyktor losowy wyjaśnia średnio proporcję 1/(n1) zmiany odpowiedzi, tak że m losowych predyktorów wyjaśnia razem, średnio m/(n1) wariantu odpowiedzi; innymi słowy, oczekiwana wartość R2 to E(R2)=m/(n1) . Zastosowanie formuły [ Radjusted2 ] do tej wartości, gdzie wszystkie predyktory są losowe, daje Radjusted2=0 ”.

Wydaje się, że jest to bardzo prosta i możliwa do interpretacji motywacja dla Radjusted2 . Jednak nie udało mi się ustalić, że E(R2)=1/(n1) dla pojedynczego losowego (tj. Nieskorelowanego) predyktora.

Czy ktoś może skierować mnie tutaj we właściwym kierunku?

gregory_britten
źródło
Jeśli w przyszłości link przestanie działać, czy możesz podać pełne odniesienie? Dziękuję Ci.
Richard Hardy,

Odpowiedzi:

10

To są dokładne statystyki matematyczne. Zobacz ten post dla wyprowadzenia rozkładu pod hipotezą, że wszystkie regresory (za wyjątkiem stałej stałej) są nieskorelowane ze zmienną zależną („predyktory losowe”).R2

Ten rozkład to Beta, gdzie jest liczbą predyktorów bez zliczania stałego składnika, a wielkości próby,mn

R2Beta(m2,nm12)

a więc

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Wydaje się to sprytnym sposobem na „uzasadnienie” logiki skorygowanego : jeśli rzeczywiście wszystkie regresory są nieskorelowane, wówczas skorygowane wynosi „średnio” zero.R2R2

Alecos Papadopoulos
źródło
2
Potrzebowałem tylko trochę informacji! Dziękuję Ci! I niech żyje wymiana stosów!
gregory_britten
1
Byłbym zainteresowany przypadkiem, w którym nie wszystkie regresory są nieskorelowane ze zmienną zależną. Czy miałbyś jakieś odniesienia na ten temat?
Olivier
@Olivier Nie Obawiam się, że nie. Zajrzyj do „Testu F pod kątem znaczenia regresji, rozkładu pod alternatywą” lub czegoś podobnego.
Alecos Papadopoulos