Jak obliczyć pasma predykcyjne dla regresji nieliniowej?

16

Strona pomocy dla Prism zawiera następujące wyjaśnienie, w jaki sposób oblicza pasma predykcyjne dla regresji nieliniowej. Przepraszam za długi cytat, ale nie postępuję zgodnie z drugim akapitem (który wyjaśnia, jak zdefiniowano G|x i obliczono dY/dP ). Każda pomoc byłaby bardzo mile widziana.

Obliczanie przedziałów ufności i predykcji jest dość standardowe. Zapoznaj się ze szczegółowymi informacjami na temat tego, w jaki sposób Pryzmat oblicza przedziały prognozowania i pewności regresji nieliniowej.

Najpierw zdefiniujmy G | x, który jest gradientem parametrów przy określonej wartości X i przy użyciu wszystkich najlepiej dopasowanych wartości parametrów. Wynikiem jest wektor z jednym elementem na parametr. Dla każdego parametru jest on definiowany jako dY / dP, gdzie Y jest wartością Y krzywej przy danej wartości X i wszystkich wartościach parametru najlepiej dopasowanego, a P jest jednym z parametrów.)

G '| x to transponowany wektor gradientowy, więc jest to raczej kolumna niż rząd wartości.

Cov jest macierzą kowariancji (odwrócony Hesjan z ostatniej iteracji). Jest to macierz kwadratowa z liczbą wierszy i kolumn równą liczbie parametrów. Każdy element w macierzy jest kowariancją między dwoma parametrami.

Teraz oblicz c = G '| x * Cov * G | x. Wynik jest pojedynczą liczbą dla dowolnej wartości X.

Pasma ufności i prognozy są wyśrodkowane na krzywej najlepszego dopasowania i rozciągają się powyżej i poniżej krzywej w równej wysokości.

Przedziały ufności rozciągają się powyżej i poniżej krzywej o: = sqrt (c) * sqrt (SS / DF) * CriticalT (% ufności, DF)

Pasma prognozy rozciągają się na dalszą odległość powyżej i poniżej krzywej, równą: = sqrt (c + 1) * sqrt (SS / DF) * CriticalT (% ufności, DF)

Joe Listerr
źródło
Mam nadzieję, że to pomoże: stats.stackexchange.com/questions/74334/…
Bipi
Mam nadzieję, że to pomoże: stats.stackexchange.com/questions/74334/…
Bipi
Jest to faktycznie znane jako metoda delta i wykorzystuje przybliżenie Taylora pierwszego rzędu. Lepiej jednak użyć do tego przybliżenia Taylora drugiego rzędu - funkcja predykcji w pakiecie propagacyjnym robi to, jeśli jesteś zainteresowany!
Tom Wenseleers

Odpowiedzi:

18

Nazywa się to metodą delta.

Załóżmy, że masz jakąś funkcję ; zwróć uwagę, że G ( ) jest funkcją szacowanych parametrów β i wartości predyktorów x . Najpierw znajdź pochodną tej funkcji w odniesieniu do wektora parametrów β : G ( β , x )y=G(β,x)+ϵG()βxβG(β,x) . Oznacza to, że jeśli zmienisz nieco parametr, o ile zmieni się twoja funkcja? Zauważ, że ta pochodna może być funkcją samych parametrów, a także predyktorów. Na przykład, jeśli , to pochodną jest x exp ( β x ) , która zależy od wartości β i wartości x . Aby to ocenić, należy podłączyć szacunków beta że procedura daje, beta , a wartość predyktora xG(β,x)=exp(βx)xexp(βx)βxββ^x gdzie chcesz prognozę.

Delta Metoda, pochodzące z najwyższych procedur prawdopodobieństwa stwierdza, że wariancja będzie G ' ( β , x ) T Var ( β ) G ' ( β , x ) , gdzie var ( βG(β^,x)

G(β^,x)TVar(β^)G(β^,x),
Var(β^)jest macierzą wariancji-kowariancji twoich oszacowań (jest to odwrotność Hesji --- druga pochodna funkcji prawdopodobieństwa według twoich oszacowań). Funkcja wykorzystywana przez pakiety statystyk oblicza tę wartość dla każdej innej wartości predyktora . Jest to tylko liczba, a nie wektor, dla każdej wartości x .xx

Daje to wariancję wartości funkcji w każdym punkcie i jest używana tak jak każda inna wariancja w obliczaniu przedziałów ufności: weź pierwiastek kwadratowy z tej wartości, pomnóż ją przez wartość krytyczną normalnego lub stosownego rozkładu t istotnego dla szczególny poziom ufności oraz dodaj i odejmij tę wartość do oszacowania w punkcie.G()

xVar(yx)σ2ϵσ^2yyσ^2SSDF

cσ2σ2σc*SS/DF

c(xx)1Var(β^)=σ2(xx)1 .

Charlie
źródło
Czy potrafisz wyjaśnić obliczenia ci? Nie wygląda jak punkt krytyczny t * sqrt (var)
B_Miner
Myślę, że rozumiem ich obliczenia; Zaktualizowałem swoją odpowiedź.
Charlie,
Charlie, bardzo dziękuję za szczegółową odpowiedź. Zamierzam napisać kod, aby móc obliczyć 95% pasmo predykcji. Dam ci znać, jak to idzie.
Joe Listerr
@Charlie - bardzo, bardzo miło!
B_Miner
2
@Charlie. Dzięki. Dodałem zdanie do naszego FAQ GraphPad Prism, wyjaśniając, że używamy cov, aby znormalizować macierz kowariancji (każda wartość mieści się w zakresie od -1 do 1). Dodałem również link do tej strony, który jest idealny dla każdego, kto szuka szczegółów matematycznych.
Harvey Motulsky,