Trudno mi to opisać, ale postaram się, aby mój problem był zrozumiały. Najpierw musisz wiedzieć, że do tej pory przeprowadziłem bardzo prostą regresję liniową. Zanim oszacowałem współczynnik, obserwowałem rozkład mojego . Jest ciężko lewy przekrzywiony. Po oszacowaniu modelu byłem całkiem pewny, że zaobserwowałem odchyloną w lewo resztkę na wykresie QQ, ale nie zrobiłem tego absolutnie. Jaki może być powód tego rozwiązania? Gdzie jest błąd? Albo ma dystrybucyjną nic wspólnego z rozkładu składnika losowego?
regression
residuals
skewness
MarkDollar
źródło
źródło
Odpowiedzi:
Aby odpowiedzieć na twoje pytanie, weźmy bardzo prosty przykład. Prosty model regresji podaje , gdzie . Załóżmy teraz, że jest dychotomiczne. Jeśli nie jest równe zero, wówczas rozkład nie będzie normalny, ale w rzeczywistości jest mieszaniną dwóch rozkładów normalnych, jednego ze średnią i jednego ze średnią .yi=β0+β1xi+ϵi ϵi∼N(0,σ2) xi β1 yi β0 β0+β1
Jeśli jest wystarczająco duży, a jest wystarczająco mały, histogram będzie wyglądał na dwumodalny. Można jednak uzyskać histogram który wygląda jak „pojedynczy” przekrzywiony rozkład. Oto jeden przykład (przy użyciu R):β1 σ2 yi yi
Liczy się nie rozkład , ale rozkład warunków błędu.yi
I to wygląda zupełnie normalnie - nie tylko w przenośni =)
źródło
W odniesieniu do doskonałej odpowiedzi @ Wolfgang, oto wykresy z jego kodu R:
źródło