Dlaczego regresja liniowa i model uogólniony mają niespójne założenia?
- W regresji liniowej zakładamy, że reszta pochodzi z gaussowskiego
- W innych regresjach (regresja logistyczna, regresja trucizny) zakładamy, że odpowiedź pochodzi z pewnego rozkładu (dwumianowy, pozycyjny itp.).
Dlaczego czasami zakładamy, że pozostały czas, a innym czas na odpowiedź? Czy dlatego, że chcemy uzyskać różne właściwości?
EDYCJA: Myślę, że mark999 pokazuje, że dwie formy są równe. Mam jednak dodatkowe wątpliwości dotyczące iid:
Moje inne pytanie: czy istnieje założenie dotyczące regresji logistycznej? pokazuje, że uogólniony model liniowy nie ma założenia iid (niezależny, ale nie identyczny)
Czy to prawda, że w przypadku regresji liniowej, jeśli założymy założenie resztkowe , będziemy mieć iid, ale jeśli postawimy założenie na podstawie
Odpowiedzi:
Prosta regresja liniowa z błędami Gaussa jest bardzo ładnym atrybutem, który nie uogólnia na uogólnione modele liniowe.
W uogólnionych modelach liniowych odpowiedź odpowiada pewnemu zadanemu rozkładowi, biorąc pod uwagę średnią . Regresja liniowa przebiega według tego wzoru; Jeśli mamy
wtedy też mamy
Oto
R
kod do zilustrowania.źródło
Jest tak, ponieważ uzależnienieXi 1, … , Xja k , traktujemy β0+ β1Xi 1+ … + ΒkXja k jako stały.
Zwykłym modelem wielokrotnej regresji liniowej z błędami normalnymi jest uogólniony model liniowy z normalną odpowiedzią i łączem tożsamości.
źródło