Obserwowano przekrzywienie w lewo względem rozkładu symetrycznego

10

Trudno mi to opisać, ale postaram się, aby mój problem był zrozumiały. Najpierw musisz wiedzieć, że do tej pory przeprowadziłem bardzo prostą regresję liniową. Zanim oszacowałem współczynnik, obserwowałem rozkład mojego . Jest ciężko lewy przekrzywiony. Po oszacowaniu modelu byłem całkiem pewny, że zaobserwowałem odchyloną w lewo resztkę na wykresie QQ, ale nie zrobiłem tego absolutnie. Jaki może być powód tego rozwiązania? Gdzie jest błąd? Albo ma dystrybucyjną nic wspólnego z rozkładu składnika losowego?yy

MarkDollar
źródło
@Aniko daje miłą odpowiedź w odpowiedzi na twoje poprzednie pytanie.
whuber

Odpowiedzi:

22

Aby odpowiedzieć na twoje pytanie, weźmy bardzo prosty przykład. Prosty model regresji podaje , gdzie . Załóżmy teraz, że jest dychotomiczne. Jeśli nie jest równe zero, wówczas rozkład nie będzie normalny, ale w rzeczywistości jest mieszaniną dwóch rozkładów normalnych, jednego ze średnią i jednego ze średnią .yi=β0+β1xi+ϵiϵiN(0,σ2)xiβ1yiβ0β0+β1

Jeśli jest wystarczająco duży, a jest wystarczająco mały, histogram będzie wyglądał na dwumodalny. Można jednak uzyskać histogram który wygląda jak „pojedynczy” przekrzywiony rozkład. Oto jeden przykład (przy użyciu R):β1σ2yiyi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

Liczy się nie rozkład , ale rozkład warunków błędu.yi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

I to wygląda zupełnie normalnie - nie tylko w przenośni =)

Wolfgang
źródło
„ale rozkład warunków błędu” Masz na myśli resztki, a nie warunki błędu, prawda? Więcej informacji na temat pozostałości kontra błąd: stats.stackexchange.com/questions/133389/…
vasili111,
7

W odniesieniu do doskonałej odpowiedzi @ Wolfgang, oto wykresy z jego kodu R:

wprowadź opis zdjęcia tutaj

Contango
źródło