W regresji liniowej przyjmujemy następujące założenia
Jednym ze sposobów rozwiązania regresji liniowej są równania normalne, które możemy zapisać jako
Z matematycznego punktu widzenia powyższe równanie wymaga tylko aby być odwracalnym. Dlaczego więc potrzebujemy tych założeń? Zapytałem kilku kolegów, którzy wspominali, że jest to dobre wyniki, a równania normalne są algorytmem do osiągnięcia tego. Ale w takim przypadku, w jaki sposób te założenia pomagają? W jaki sposób ich utrzymanie pomaga uzyskać lepszy model?
regression
assumptions
Zegar Slave
źródło
źródło
Odpowiedzi:
Masz rację - nie musisz spełniać tych założeń, aby dopasować linię najmniejszych kwadratów do punktów. Potrzebujesz tych założeń do interpretacji wyników. Na przykład, zakładając, że nie ma związku między wejściem i Y , jakie jest prawdopodobieństwo uzyskania współczynnika β 1 co najmniej tak dużego, jak to, co widzieliśmy z regresji?X1 Y β1
źródło
Spróbuj wizerunku kwartet anscombe'a z Wikipedii aby zorientować się, niektóre z potencjalnych problemów z interpretacji regresji liniowej, gdy niektóre z tych założeń są wyraźnie fałszywe: większość podstawowych statystyk opisowych są takie same we wszystkich czterech (a osoba wartości są identyczne we wszystkich oprócz prawego dolnego rogu)xi
źródło
Nie potrzebujesz tych założeń, aby dopasować model liniowy. Jednak oszacowania parametrów mogą być stronnicze lub nie mieć minimalnej wariancji. Naruszenie założeń utrudni interpretację wyników regresji, na przykład konstruowanie przedziału ufności.
źródło
Ok, odpowiedzi jak dotąd są następujące: jeśli naruszymy założenia, mogą się zdarzyć złe rzeczy. Uważam, że interesującym kierunkiem jest: kiedy wszystkie założenia, których potrzebujemy (a właściwie trochę inne od powyższych), są spełnione, dlaczego i jak możemy być pewni, że regresja liniowa jest najlepszym modelem?
źródło
Dwa kluczowe założenia to:
Zobacz dyskusję w książce Juliana Faraway .
Jeśli oba są prawdziwe, OLS jest zaskakująco odporny na naruszenia innych wymienionych przez ciebie założeń.
źródło