Prowadzę prezentację na temat dopasowania linii. Mam prostą funkcję liniową, . Próbuję uzyskać rozproszone punkty danych, które mogę umieścić na wykresie rozrzutu, który utrzyma moją linię najlepszego dopasowania na tym samym równaniu.
Chciałbym nauczyć się tej techniki w R lub Excel - w zależności od tego, co jest łatwiejsze.
r
regression
least-squares
excel
Ryan Chase
źródło
źródło
Odpowiedzi:
Wybierz dowolny(xi) pod warunkiem, że co najmniej dwa z nich się różnią. Ustaw punkt przecięcia β0 i nachylenie β1 i zdefiniuj
To dopasowanie jest idealne. Bez zmiany dopasowania można zmodyfikowaćy0 do y= y0+ ε przez dodanie do niego dowolnego wektora błędu ε = ( εja) , pod warunkiem że jest on ortogonalny zarówno do wektora x = ( xja) i wektora stałego ( 1 , 1 , … , 1 ) . Łatwym sposobem na uzyskanie takiego błędu jest wybranie dowolnego wektora mi i niech ε będzie resztą po regresji mi przeciw x . W poniższym kodzie mi jest generowany jako zbiór niezależnych losowych wartości normalnych ze średnią 0 i wspólnym odchyleniem standardowym.
Co więcej, można nawet preselekcji ilości rozproszonego, być może poprzez określenie coR2) powinno być. Niech τ2)= var ( yja) = β2)1var ( xja) , przeskaluj te reszty, aby mieć wariancję
Ta metoda jest w pełni ogólna: w ten sposób można utworzyć wszystkie możliwe przykłady (dla danego zestawuxja ).
Przykłady
Kwartet Anscombe
Możemy z łatwością odtworzyć Kwartet Anscombe czterech jakościowo odrębnych dwuwymiarowych zbiorów danych o takich samych statystykach opisowych (w drugim rzędzie).
Kod jest niezwykle prosty i elastyczny.
Dane wyjściowe dają statystyki opisowe drugiego rzędu dla danych( x , y) dla każdego zestawu danych. Wszystkie cztery linie są identyczne. Możesz łatwo utworzyć więcej przykładów, zmieniając
x
(współrzędne x) ie
(wzorce błędów) na początku.Symulacje
R
(Przeniesienie tego do Excela nie byłoby trudne - ale jest to trochę bolesne).
summary(fit)
źródło