Błąd standardowy to szacowane odchylenie standardowe estymatora dla parametru .
Dlaczego szacowane odchylenie standardowe reszt określa się jako „resztkowy błąd standardowy” (np. Na wyjściu funkcji R summary.lm
), a nie „resztowe odchylenie standardowe”? Jakie parametry szacunkowe wyposażamy tutaj w standardowy błąd?
Czy uważamy każdą resztę za estymator dla „jego” terminu błędu i szacujemy „zbiorczy” błąd standardowy wszystkich tych estymatorów?
r
standard-error
residuals
terminology
Michael M.
źródło
źródło
Odpowiedzi:
Myślę, że frazowanie jest specyficzne dla
summary.lm()
wyjścia R. Zauważ, że podstawowa wartość jest tak naprawdę nazywana „sigma” (summary.lm()$sigma
). Nie sądzę, aby inne oprogramowanie koniecznie używa tej nazwy do standardowego odchylenia reszt. Ponadto sformułowanie „resztkowe odchylenie standardowe” jest na przykład powszechne w podręcznikach. Nie wiem, jak to się stało, że frazowanie zostało użyte wsummary.lm()
danych wyjściowych R. Ale zawsze myślałem, że to dziwne.źródło
summary.lm(reg)$sigma
różnisd(reg$residuals)
?stats::sigma
: Mylny „Resztkowy błąd standardowy” był częścią zbyt wielu wyników R (i S), aby można je tam łatwo zmienić.Z mojego szkolenia ekonometrycznego nazywa się to „resztkowym błędem standardowym”, ponieważ jest to oszacowanie rzeczywistego „resztkowego odchylenia standardowego”. Zobacz to pokrewne pytanie, które potwierdza tę terminologię.
Wyszukiwarka Google terminu szczątkowy błąd standardowy również pokazuje wiele trafień, więc w żadnym wypadku nie jest to dziwność R. Wypróbowałem oba terminy z cytatami i oba pojawiają się około 60 000 razy.
źródło
Błąd standardowy - Wikipedia, darmowa encyklopedia
źródło
Dopasowany model regresji wykorzystuje parametry do generowania prognoz oszacowania punktowego, które są średnimi obserwowanymi odpowiedziami, jeśli powielisz badanie z tymi samymi wartościami XX nieskończoną liczbę razy ( gdy model liniowy jest prawdziwy ).
Różnica między tymi przewidywanymi wartościami a wartościami zastosowanymi do dopasowania modelu nazywa się „ Resztkami ”, które podczas replikacji procesu gromadzenia danych mają właściwości zmiennych losowych o wartości 0. Zaobserwowane pozostałości są następnie wykorzystywane do późniejszego oszacowania zmienności tych wartości i do oszacowania rozkładu próbkowania parametrów.
Uwaga:
Gdy rezydualny błąd standardowy wynosi dokładnie 0, wówczas model idealnie pasuje do danych (prawdopodobnie z powodu przeregulowania).
Jeśli nie można wykazać, że rezydualny błąd standardowy różni się znacząco od zmienności bezwarunkowej odpowiedzi, wówczas niewiele jest dowodów na to, że model liniowy ma jakąkolwiek zdolność predykcyjną.
źródło