Pakiet kreślarski R ggplot2 ma niesamowitą funkcję o nazwie stat_smooth do kreślenia linii regresji (lub krzywej) z powiązanym pasmem ufności.
Trudno mi jednak dokładnie ustalić, w jaki sposób generowany jest ten przedział ufności, dla każdej linii regresji (lub „metody”). Jak mogę znaleźć te informacje?
r
regression
confidence-interval
ggplot2
static_rtti
źródło
źródło
Odpowiedzi:
Z
Details
sekcji pomocyTak więc predykcja na ogół wywoła funkcję
stats::predict
, która z kolei wywoła poprawnąpredict
metodę dla metody wygładzania. Przydatne są również inne funkcje dotyczące stat_smooth .Większość funkcji dopasowania modelu będzie miała
predict
metodę powiązaną zclass
modelem. Zwykle przyjmąnewdata
obiekt i argument,se.fit
który wskaże, czy zostaną dopasowane standardowe błędy. (patrz?predict
) w celu uzyskania dalszych informacji.Jest to przekazywane bezpośrednio do metody przewidywanej, aby zwrócić odpowiednie błędy standardowe (zależne od metody)
Określa
newdata
wartości, dlax
których będą oceniane prognozyPrzekazany bezpośrednio do metody prognozowania, aby przedział ufności mógł zdefiniować odpowiednią wartość krytyczną (np.
predict.lm
Zastosowaniaqt((1 - level)/2, df)
do pomnożenia standardowych błędów przezUżywany w połączeniu z
fullrange
do definiowaniax
wartości wnewdata
obiekcie.W ramach połączenia
stat_smooth
możesz zdefiniować,se
co jest częściowo dopasowane dose.fit
(lubse
) i zdefiniowaćinterval
argument, jeśli to konieczne.level
poda poziom przedziału ufności (domyślnie 0,95).newdata
Obiekt jest zdefiniowany w przetwórstwie, w zależności od ustawieniafullrange
dla sekwencji o długościn
w pełnym zakresie działki lub danych.W twoim przypadku użycie
rlm
spowoduje użycie tegopredict.rlm
, co jest zdefiniowane jakoWięc wywołuje wewnętrznie
predict.lm
z odpowiednim skalowaniemqr
rozkładu iscale
argumentów.źródło
predict
działał rozsądnie, jeśli metoda została skonfigurowana w standardowy sposób. Zredagowałem swoją odpowiedź, aby rozwiązać problemy poruszone w pierwszym komentarzu.