Mam problem ze zrozumieniem, jak używać ładowania początkowego do obliczania przedziałów predykcji dla modelu regresji liniowej. Czy ktoś może nakreślić procedurę krok po kroku? Szukałem przez Google, ale nic tak naprawdę nie ma dla mnie sensu.
Rozumiem, jak używać ładowania początkowego do obliczania przedziałów ufności dla parametrów modelu.
Odpowiedzi:
Przedziały ufności uwzględniają niepewność szacowania. Przedziały prognoz dodają do tego fundamentalną niepewność. R
predict.lm
da przedział predykcji dla modelu liniowego. Stamtąd wszystko, co musisz zrobić, to uruchomić go wielokrotnie na próbkach bootstrapped.Wynikiem
replicate
jest trójwymiarowa tablica (n
x3
xn.bs
). Wymiar długości 3 składa się z dopasowanej wartości dla każdego elementu danych oraz dolnej / górnej granicy 95% przedziału predykcji.Metoda Gary'ego Kinga
W zależności od tego, co chcesz, istnieje fajna metoda Kinga, Tomza i Wittenberga . Jest stosunkowo łatwy do wdrożenia i pozwala uniknąć problemów z ładowaniem w przypadku niektórych oszacowań (np
max(Y)
.).Przytoczę tutaj jego definicję fundamentalnej niepewności, ponieważ jest ona dość przyjemna:
źródło
Bootstrapping nie zakłada żadnej wiedzy o formie podstawowego rozkładu macierzystego, z którego powstała próbka. Tradycyjne klasyczne oszacowania parametrów statystycznych opierają się na założeniu normalności. Bootstrap dotyczy nienormalności i jest bardziej dokładny w praktyce niż metody klasyczne.
Bootstrapping zastępuje surową moc obliczeniową komputera rygorystyczną analizą teoretyczną. Jest to oszacowanie rozkładu próbkowania terminu błędu zestawu danych. Bootstrapping obejmuje: ponowne próbkowanie zestawu danych określoną liczbę razy, obliczanie średniej z każdej próbki i znalezienie standardowego błędu średniej.
Poniższy kod „R” demonstruje tę koncepcję:
Ten praktyczny przykład pokazuje przydatność ładowania początkowego i szacuje błąd standardowy. Błąd standardowy jest wymagany do obliczenia przedziału ufności.
Załóżmy, że masz wypaczony zestaw danych „a”:
wizualizacja przekrzywionego zestawu danych
Wykonaj procedurę ładowania początkowego:
źródło