Przy ciągłych danych regresja liniowa zakłada, że termin błędu jest rozproszony N (0, )
1) Czy zakładamy, że Var (Y | x) jest również ~ N (0, )?
2) Czym jest ten rozkład błędów w regresji logistycznej? Gdy dane mają postać 1 rekordu na przypadek, gdzie „Y” wynosi 1 lub 0, oznacza to błąd błędu rozproszonego Bernoulliego (tzn. Wariancja wynosi p (1-p))) i gdy dane mają postać # sukcesy z # prób, czy przyjmuje się, że jest dwumianowy (tzn. wariancja wynosi np (1-p)), gdzie p jest prawdopodobieństwem, że Y wynosi 1?
logistic
generalized-linear-model
B_Miner
źródło
źródło
Odpowiedzi:
1) Jeśli ma rozkład normalny, tj. to , ponieważ nie jest zmienną losową.u N.( 0 ,σ2)) V.a r ( Y|X2)) = Va r (β1+β2)X2)) + V.a r ( u ) = 0 +σ2)=σ2) β1+β2)X2)
2) W regresji logistycznej zakłada się, że błędy są zgodne z rozkładem dwumianowym, jak wspomniano tutaj . Lepiej jest napisać jako , ponieważ te prawdopodobieństwa zależą od , jak podano tutaj lub w Zastosowanej regresji logistycznej .V.a r (Yjot|Xjot) =mjot. mi[Yjot|Xjot] . ( 1 - E[Yjot|Xjot] ) =mjotπ(Xjot) . ( 1 - π(Xjot) ) Xjot
źródło