Dlaczego R wykreśla znormalizowane reszty w stosunku do teoretycznych kwantyli na wykresie QQ?

9

W R, dlaczego domyślne ustawienia qqplot(linear model)używają znormalizowanych reszt na osi y? Dlaczego R nie używa „regularnych” reszt?

MarkDollar
źródło

Odpowiedzi:

13

Gdy używasz standaryzowanych reszt, oczekiwana wartość reszt wynosi zero, a wariancja wynosi (w przybliżeniu) jeden. Ma to dwie zalety:

  1. Jeśli przeskalujesz jedną ze swoich zmiennych (powiedzmy zmień kilometry na mile), pozostałe wykresy pozostaną niezmienione.
  2. Na wykresie qq reszty powinny leżeć na linii y = x
  3. Oczekujesz, że 95% twoich reszt będzie się mieścić między -1,96 a 1,96. Ułatwia to wykrywanie wartości odstających.
csgillespie
źródło
Czy możesz podać mi informację, że 95% powinno mieścić się w przedziale -1,96; 1,96. Innymi słowy, dlaczego znormalizowane reszty powinny być ? diN(0,1)
MarkDollar
@Mark: Wystarczy google „znormalizowane pozostałości” i spojrzeć na kilka pierwszych trafień.
csgillespie
4

Teoretyczne reszty w modelu liniowym są niezależnie identycznie normalnie rozmieszczone. Jednak zaobserwowane reszty nie są niezależne i nie mają równych wariancji. Tak więc standaryzacja reszt dzieli się przez szacowane odchylenie standardowe związane z tą resztą, czyniąc je bardziej równymi w ich wariancjach (używając informacji z macierzy kapelusza do obliczenia tego). Jest to bardziej znacząca reszta do obejrzenia w qqplot.

Czy naprawdę używasz qqplot na dopasowanym modelu? czy jest to qqplot z działki na modelu?

Greg Snow
źródło
1
Hej! Mówię o qqplot z działki (> lm <). Dzięki za odpowiedź. Chciałbym dać cs znak, ponieważ jego odpowiedź była szybsza. Mam nadzieję, że Ci to odpowiada :)
MarkDollar