Jeśli najlepszym przybliżeniem liniowym (przy użyciu najmniejszych kwadratów) moich punktów danych jest linia , jak mogę obliczyć błąd przybliżenia? Jeśli obliczę odchylenie standardowe różnic między obserwacjami i prognozami , czy mogę później powiedzieć, że rzeczywista (ale nie zaobserwowana) wartość należy do przedziału ( y p = m x 0 + b ) z prawdopodobieństwem ~ 68%, przy założeniu rozkładu normalnego?
Wyjaśnić:
Dokonałem obserwacji dotyczących funkcji , oceniając ją w kilku punktach x i . Dopasowuję te obserwacje do linii l ( x ) = m x + b . Dla x 0 , którego nie obserwowałem, chciałbym wiedzieć, jak duże może być f ( x 0 ) - l ( x 0 ) . Stosując powyższą metodę, czy poprawne jest stwierdzenie, że f ( x 0 ) ∈ [ l ( x 0 z prob. ~ 68%?
Odpowiedzi:
@whuber wskazał ci trzy dobre odpowiedzi, ale być może nadal mogę napisać coś wartościowego. Wasze wyraźne pytanie, jak rozumiem, brzmi:
Biorąc pod uwagę, my wyposażonay^i=m^xi+b^ (zauważ, że dodana 'kapeluszy') , i przy założeniu, że reszty moi zazwyczaj rozproszone, , można przewidzieć, że dotychczas zauważony reakcji, r n e w , o znanej wartości czynnikiem, x n e w , będzie mieścić się w przedziale ( Y - σ e , y + σN(0,σ^2e) ynew xnew , z prawdopodobieństwem 68%?(y^−σe,y^+σe)
Intuitively, the answer seems like it should be 'yes', but the true answer is maybe. This will be the case when the parameters (i.e.,m,b, & σ ) are known and without error. Since you estimated these parameters, we need to take their uncertainty into account.
Having calculated the correct value in this manner, we can then use it with the appropriatet distribution as noted above.
źródło