Moje przewidywania pochodzące z modelu regresji logistycznej (glm w R) nie są ograniczone od 0 do 1, jak bym się spodziewał. Rozumiem, że regresja logistyczna polega na tym, że parametry wejściowe i modelowe są łączone liniowo, a odpowiedź jest przekształcana w prawdopodobieństwo za pomocą funkcji logit link. Ponieważ funkcja logit jest ograniczona od 0 do 1, spodziewałem się, że moje przewidywania będą ograniczone od 0 do 1.
Jednak tego nie widzę, gdy wdrażam regresję logistyczną w R:
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
Jeśli cokolwiek, wynik przewidywania (modelu) wygląda dla mnie normalnie. Czy ktoś może mi wyjaśnić, dlaczego wartości, które otrzymuję, nie są prawdopodobieństwami?
Odpowiedzi:
predict.glm
Metoda domyślnie zwraca czynników predykcyjnych w skali predyktora liniowego. Tzn. Nie przeszli jeszcze przez funkcję link.Próbować
hist(predict(model, type = "response"))
zamiast
źródło