Zrozumienie prognoz regresji logistycznej

13

Moje przewidywania pochodzące z modelu regresji logistycznej (glm w R) nie są ograniczone od 0 do 1, jak bym się spodziewał. Rozumiem, że regresja logistyczna polega na tym, że parametry wejściowe i modelowe są łączone liniowo, a odpowiedź jest przekształcana w prawdopodobieństwo za pomocą funkcji logit link. Ponieważ funkcja logit jest ograniczona od 0 do 1, spodziewałem się, że moje przewidywania będą ograniczone od 0 do 1.

Jednak tego nie widzę, gdy wdrażam regresję logistyczną w R:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

wprowadź opis zdjęcia tutaj

Jeśli cokolwiek, wynik przewidywania (modelu) wygląda dla mnie normalnie. Czy ktoś może mi wyjaśnić, dlaczego wartości, które otrzymuję, nie są prawdopodobieństwami?

Adrian
źródło
3
Poniższa odpowiedź Corone ładnie opisuje szczegóły. Oryginalna liczba, którą masz powyżej, przedstawia wartości logarytmiczne szans na osi x, które można matematycznie przekształcić w prawdopodobieństwa (tj. Zgodnie z odpowiedzią Corone, przekazując z powrotem przez funkcję link.)
James Stanley

Odpowiedzi:

16

predict.glmMetoda domyślnie zwraca czynników predykcyjnych w skali predyktora liniowego. Tzn. Nie przeszli jeszcze przez funkcję link.

Próbować

hist(predict(model, type = "response"))

zamiast

wprowadź opis zdjęcia tutaj

Corone
źródło
4
Wykonałeś świetną robotę, opanowując nasze funkcje znaczników i ilustracji w krótkim czasie: ta odpowiedź jest tego dobrym przykładem. Dobra robota!
whuber