W R, jeśli napiszę
lm(a ~ b + c + b*c)
czy nadal byłaby to regresja liniowa?
Jak zrobić inne rodzaje regresji w R? Byłbym wdzięczny za jakieś zalecenia dotyczące podręczników lub samouczków?
r
regression
suprvisr
źródło
źródło
lm()
oznacza regresję liniową. Twój model zawiera trzy parametry (minus punkt przecięcia) dlab
,c
oraz ich interakcjęb:c
, która oznaczab + c + b:c
lubb*c
w skrócie (R jest zgodny z notacją Wilkinsona dla modeli statystycznych). Wymagane jest dopasowanie uogólnionego modelu liniowego (tzn. Gdy funkcja połączenia nie jest identyczna, jak ma to miejsce w przypadku modelu liniowego wyrażonego powyżej)glm()
.Odpowiedzi:
Liniowy odnosi się do związku między parametrami, które szacujesz (np. ), a wynikiem (np. ). Zatem jest liniowy, ale nie jest. Model liniowy oznacza, że oszacowanie wektora parametru można zapisać , gdzie to wagi określone przez procedurę szacowania. Modele liniowe można rozwiązywać algebraicznie w formie zamkniętej, podczas gdy wiele modeli nieliniowych musi zostać rozwiązanych poprzez maksymalizację numeryczną za pomocą komputera.β yi y=exβ+ϵ y=eβx+ϵ β^=∑iwiyi {wi}
źródło
Ten post na minitab.com zawiera bardzo jasne wyjaśnienie:
Response = constant + parameter * predictor + ... + parameter * predictor
źródło
Byłbym ostrożny, zadając to pytanie jako „regresji liniowej R” w porównaniu z pytaniem „regresji liniowej”. Formuły w R mają reguły, o których możesz wiedzieć lub nie. Na przykład:
http://wiener.math.csi.cuny.edu/st/stRmanual/ModelFormula.html
Zakładając, że pytasz, czy poniższe równanie jest liniowe:
Odpowiedź brzmi tak, jeśli utworzysz nową zmienną niezależną, taką jak:
Zastąpienie powyższego równania newv pierwotnym równaniem prawdopodobnie wygląda na to, czego oczekujesz od równania liniowego:
Jeśli chodzi o referencje, Google „regresja” lub cokolwiek, co Twoim zdaniem może działać dla Ciebie.
źródło
a
występuje funkcja liniowa czterech współczynników.Możesz zapisać regresję liniową jako (liniowe) równanie macierzowe.
lub jeśli zwiniesz to:
Ta regresja liniowa jest równoważna znalezieniu liniowej kombinacji wektorów , i najbliższej wektorowi .b c b∗c a
(Ma to również interpretację geometryczną, jak znalezienie rzutu na rozpiętość wektorów , i . W przypadku problemu z dwoma wektorami kolumnowymi z trzema pomiarami można to nadal narysować jako rysunek, na przykład jak pokazano tutaj: http://www.math.brown.edu/~banchoff/gc/linalg/linalg.html )b c b ∗ ca b c b∗c
Zrozumienie tej koncepcji jest również ważne w regresji nieliniowej. Na przykład o wiele łatwiej jest rozwiązać niż ponieważ pierwsza parametryzacja pozwala rozwiązać oraz współczynnikom technik regresji liniowej. y = u ( e c ( t - v ) + e d ( t - v ) ) a by=aect+bedt y=u(ec(t−v)+ed(t−v)) a b
źródło