Mam problem z regresją, w którym wyniki nie są ściśle 0, 1, ale raczej mieszczą się w zakresie wszystkich liczb rzeczywistych od 0 do 1 włącznie .
Problem ten został już omówiony w tym wątku , chociaż moje pytanie jest nieco inne.
Nie mogę użyć regresji liniowej z tych samych powodów, dla których regresja logistyczna jest zwykle stosowana. W regresji liniowej A) bardzo duże wartości IV wypaczą przewidywany wynik do 1 i B) wynik regresji liniowej nie jest ograniczony do granic 0,1.
Patrząc na tę funkcję kosztów logistycznych z mojego podręcznika
Czy byłoby możliwe zastosowanie regresji logistycznej poprzez modyfikację funkcji kosztu w celu zmierzenia wszystkich błędów hipotezy?
źródło
glm()
funkcję pełni R, gdy jest zasilany ciągłą odpowiedzią ifamily=quasibinomial
? Czyli oszacuje współczynniki,family=binomial
a następnie, w dodatkowym kroku, obliczy standardowe błędy z uwzględnieniem nadmiernej dyspersji? Jeśli tak, to czy to samo, co obliczanie „solidnych błędów standardowych”? Mam odpowiednie dane i wypróbowałem obie rodzinyglm
; Otrzymuję identyczne współczynniki, ale różne błędy standardowe. Dzięki.Gdy Y jest ograniczone, regresja beta często ma sens; zobacz artykuł „A Better Lemon Squeezer”
Pozwala to na efekty podłogowe i sufitowe; pozwala również modelować wariancję, a także średnią.
źródło
Ponieważ y nie jest ściśle zerowe lub jeden (jak powiedziałeś) koszt powinien zawsze być większy niż zero. Więc nie sądzę, że potrzebujesz modyfikacji w modelu.
źródło
Proponuję dwa alternatywne modele:
Jeśli twoje wyniki (zmienne y) są uporządkowane, wypróbuj model Zamówiony Probit.
Jeśli wyniki (zmienne y) nie są uporządkowane, wypróbuj model Login wielomianowy.
źródło