Podczas uruchamiania modelu regresji wielokrotnej w R jednym z wyjść jest resztkowy błąd standardowy wynoszący 0,0589 przy 95161 stopniach swobody. Wiem, że 95.161 stopni swobody wynika z różnicy między liczbą obserwacji w mojej próbce a liczbą zmiennych w moim modelu. Jaki jest pozostały błąd standardowy?
regression
standard-error
residuals
ustroetz
źródło
źródło
Odpowiedzi:
Dopasowany model regresji wykorzystuje parametry do generowania prognoz oszacowania punktowego, które są średnimi obserwowanymi odpowiedziami, jeśli powielisz badanie z tymi samymi wartościami nieskończoną liczbę razy (i gdy model liniowy jest prawdziwy). Różnica między tymi przewidywanymi wartościami a wartościami zastosowanymi do dopasowania modelu nazywa się „resztkami”, które podczas replikacji procesu gromadzenia danych mają właściwości zmiennych losowych o wartości 0.X
Zaobserwowane pozostałości są następnie wykorzystywane do późniejszego oszacowania zmienności tych wartości i do oszacowania rozkładu próbkowania parametrów. Gdy rezydualny błąd standardowy wynosi dokładnie 0, model idealnie pasuje do danych (prawdopodobnie z powodu przeszacowania). Jeśli nie można wykazać, że rezydualny błąd standardowy różni się znacząco od zmienności bezwarunkowej odpowiedzi, wówczas niewiele jest dowodów na to, że model liniowy ma jakąkolwiek zdolność predykcyjną.
źródło
Powiedzmy, że mamy następującą tabelę ANOVA (dostosowaną z
example(aov)
polecenia R ):Jeśli podzielisz sumę kwadratów z dowolnego źródła zmienności (modelu lub reszt) przez odpowiednie stopnie swobody, otrzymasz średni kwadrat. W szczególności dla pozostałości:
A zatem 76,57 jest średnim kwadratem reszt, tj. Ilością zmian resztkowych (po zastosowaniu modelu) zmiennej zmiennej odpowiedzi.
źródło
RSE wyjaśniono dość wyraźnie w „Wprowadzenie do uczenia statystycznego”.
źródło