Regresja logistyczna i punkt zapalny

11

Mamy dane z wynikiem binarnym i niektóre zmienne towarzyszące. Użyłem regresji logistycznej do modelowania danych. Po prostu prosta analiza, nic nadzwyczajnego. Ostatecznym wyjściem ma być krzywa zależności odpowiedzi od dawki, na której pokazujemy, jak zmienia się prawdopodobieństwo dla konkretnej zmiennej towarzyszącej. Coś takiego:

wprowadź opis zdjęcia tutaj

Otrzymaliśmy krytykę od wewnętrznego recenzenta (nie tylko statystycznego) za wybór regresji logistycznej. Regresja logistyczna zakłada (lub definiuje), że punkt przegięcia krzywej w kształcie litery S na skali prawdopodobieństwa wynosi prawdopodobieństwo 0,5. Argumentował, że nie ma powodu, aby zakładać, że punkt przegięcia rzeczywiście ma prawdopodobieństwo 0,5 i powinniśmy wybrać inny model regresji, który pozwala na zmianę punktu przegięcia tak, aby rzeczywista pozycja była sterowana danymi.

Na początku zaskoczył mnie jego argument, ponieważ nigdy nie myślałem o tym punkcie. Nie miałem żadnych argumentów, dlaczego uzasadnione byłoby założenie, że punkt przegięcia wynosi 0,5. Po przeprowadzeniu badań wciąż nie mam odpowiedzi na to pytanie.

Natknąłem się na 5-parametrową regresję logistyczną, dla której punkt przegięcia jest dodatkowym parametrem, ale wydaje się, że ten model regresji jest zwykle używany podczas tworzenia krzywych dawka-odpowiedź z ciągłym wynikiem. Nie jestem pewien, czy i jak można go rozszerzyć na binarne zmienne odpowiedzi.

Myślę, że moje główne pytanie brzmi: dlaczego lub kiedy można założyć, że punkt przegięcia dla regresji logistycznej wynosi 0,5? Czy to w ogóle ma znaczenie? Nigdy nie widziałem, żeby ktoś pasował do modelu regresji logistycznej i wyraźnie dyskutował o kwestii punktu przegięcia. Czy istnieją alternatywy dla utworzenia krzywej odpowiedzi na dawkę, w której punkt przegięcia niekoniecznie wynosi 0,5?

Dla kompletności kod R do wygenerowania powyższego obrazu:

dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")

Edycja 1:

Wystarczy dodać do tego, co powiedział Scortchi w jednym z komentarzy: Recenzent rzeczywiście twierdził, że biologicznie bardziej prawdopodobne jest, że zmiana krzywizny nastąpi wcześniej niż 0,5. Dlatego jego opór wobec założenia, że ​​punkt przegięcia wynosi 0,5.

Edycja 2:

W reakcji na komentarz Franka Harrella:

Jako przykład zmodyfikowałem mój model powyżej, aby uwzględnić kwadratowy i sześcienny termin w gre(który jest „dawką” w tym przykładzie).

logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+  gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

wprowadź opis zdjęcia tutaj

Pomimo tego, że dodanie grew tym przypadku wyrażenia kwadratowego i sześciennego prawdopodobnie nie ma sensu , widzimy, że zmieniła się forma krzywej dawka-odpowiedź. Rzeczywiście mamy teraz dwa punkty przegięcia na około 0,25 i blisko 0,7.

Francis
źródło
2
Czy to nie jest to samo, co prośba o zbadanie nieliniowych związków predyktorów z logarytmicznym prawdopodobieństwem odpowiedzi?
Scortchi - Przywróć Monikę

Odpowiedzi:

8

Jak poruszył @scortchi, recenzent działał pod fałszywym wrażeniem, że nie jest możliwe modelowanie nieliniowych efektów predyktorów na skali logitów w kontekście regresji logistycznej. Pierwotny model szybko przyjął liniowość wszystkich predyktorów. Poprzez złagodzenie założenia liniowości, stosując na przykład ograniczone splajny sześcienne (splajny naturalne), cały kształt krzywej jest elastyczny, a punkt przegięcia nie stanowi już problemu. Gdyby istniał jeden predyktor i zostałby rozszerzony za pomocą splajnu regresji, można by powiedzieć, że model logistyczny przyjmuje jedynie założenia płynności i niezależności obserwacji.

Frank Harrell
źródło
Muszę przyznać, że nie znam się na regresji splajnu. Jak bym to zrobił z regresją logistyczną (w R). Zmodyfikowałem swój oryginalny post (edycja 2), aby uwzględnić predyktory w wielomianach. Czy mogę użyć tego jako alternatywy dla wygładzania splajnu. Oczywiście nie mam takiej elastyczności, jak w przypadku splajnów.
Francis
1
@Franco: własne strategie modelowania regresji Franka Harrella - książka , strona internetowa , pakiet R. - powinny zacząć. Krótka dyskusja na temat niektórych zalet splajnów regresji znajduje się tutaj ; ale oczywiście masz rację, że wielomiany są alternatywą.
Scortchi - Przywróć Monikę
4

Wydaje mi się, że recenzent po prostu szukał czegoś do powiedzenia. Przed zbadaniem takich cech specyfikacji, jak domniemany punkt przegięcia, istnieje mnóstwo założeń, które przyjęliśmy, aby dojść do możliwego do oszacowania modelu. Wszystko można kwestionować i debatować - wykorzystanie samej funkcji logistycznej jest możliwym głównym celem: kto powiedział nam, że warunkowy rozkład warunku błędu jest logistyczny? Nikt.

Tak więc pytanie brzmi: co oznacza zmiana krzywizny? Jak ważne dla badanego zjawiska w świecie rzeczywistym może być moment, w którym następuje zmiana krzywizny, abyśmy mogli rozważyć uczynienie go „sterowanym danymi”? Odchodzisz od zasady parsimony?

Pytanie nie brzmi „dlaczego punkt przegięcia powinien wynosić 0,5?” Ale „jak może być mylące dla naszych wniosków, jeśli zostanie pozostawione na poziomie 0,5?”.

Alecos Papadopoulos
źródło
2
To wydaje się trochę nie do zniesienia. Nie wiemy, że recenzent nie miał dobrego powodu, aby zakwestionować to założenie, a nie innych, z którymi mógł się zakwestionować. Odsuńcie na bok dziwny sposób określania go pod względem punktów przegięcia i możliwego nieporozumienia na temat regresji logistycznej, a on w zasadzie pyta, dlaczego model pozwala przesuwać i rozciągać krzywą, ale nie wyginać się, co może zasługiwać na odpowiedź.
Scortchi - Przywróć Monikę
@Scortchi „dziwny sposób oddania tego”… ”możliwe błędne przekonanie na temat regresji logistycznej” ... Jeśli tego właśnie potrzeba, aby zracjonalizować krytykę recenzenta, nie powinien był w ogóle recenzować artykułu.
Alecos Papadopoulos
1
Podobnie jak w przypadku @Scortchi uważam to za zbyt ostre. Wielu bardziej aktywnych ludzi ma tu pochodzenie z różnych dziedzin nauki, a nie ze statystyk głównego nurtu. Bycie statystykiem, czystym czy innym, nie jest ani niezbędne, ani wystarczające, aby udzielić dobrych rad (choć w prawie wszystkich przypadkach oczywiście pomoże).
Nick Cox,
@Nick Cox Akceptuję „ostrość” i właśnie usunąłem ostatnie zdanie, jako znak konsensusu. Chodzi mi o to, że ogólne kwestionowanie założeń modelu nie ma żadnej wartości - modele są zawsze fałszywe. JEŚLI prawdopodobieństwo, że zmiany krzywizny są w jakiś sposób krytyczne dla badanego zjawiska w świecie rzeczywistym, to recenzent miał rację, pytając, czy ten punkt jest oparty na danych. Ale jeśli recenzent skomentował „dlaczego przy p = 0,5, a nie gdzie indziej?”, Ten komentarz nie jest konstruktywny.
Alecos Papadopoulos
2
Dzięki za to. Zgadzam się z twoim ogólnym stanowiskiem: (a) dyskusja na temat zalet różnych podejść oraz (b) dyskusja na temat tego, w jaki sposób powinniśmy omówić obie te kwestie, są uczciwą grą. Komentarze na temat osób lub nawet grup zwykle nie są pomocne (chociaż ja czasami irytuję linię w rozdrażnieniu ...).
Nick Cox
0

W przypadku mho regresja logit jest rozsądnym wyborem dla odpowiedzi na dawkę. Oczywiście możesz użyć probit, log-log, c-log-log link i porównać stopień dopasowania (DEV, BIC, CAIC itp.). Ale najprostsza regresja logit daje wygodną formalną ocenę punktu przegięcia LD50 = -b0 / b1. Pamiętamy, że jest to szczególny punkt, dla którego uzyskujemy minimalną niepewność (por. LD16, LD84 i wszelkie inne będą miały szersze CI, patrz „Analiza probitowa” Finneya, 1947, 1977). zawsze (?) Lepiej było użyć logarytmu dawki, a następnie po prostu przekonwertować 95% CI w oryginalnej skali. Jaka jest natura innych zmiennych towarzyszących w modelu? Nawiązuję do możliwości zastosowania podejścia wielomodelowego ... Oczywiście splajny są elastyczne, ale parametry formalne są interpretowane łatwiej!

Zobacz http://www.epa.gov/ncea/bmds/bmds_training/software/overp.htm

Ivan Kshnyasev
źródło
0

Punkt przegięcia 0,5 jest małą częścią większego pytania: równanie logistyczne jest konstrukcyjnie symetryczne. I w większości pochodnych modelowany efekt ma powód, aby być symetrycznym. np. gdy jeden gracz wygrywa, drugi traci, lub efekt odpowiedzialny za nasycenie jest tym samym efektem fizycznym, który odpowiada za początkowy wzrost itp. Więc jeśli istnieje powód, dla którego źródło zachowania o niskim X jest tego samego pochodzenia ponieważ prawa ręka zachowuje się z jakiegokolwiek innego powodu, problem jest symetryczny, więc masz swoje uzasadnienie.

jeśli nie, być może następnym najprostszym modelem jest uogólnione równanie logistyczne. ma więcej parametrów i możesz chcieć dodać ograniczenie, aby nie wszystkie były parametrami bezpłatnymi. jest to prawdopodobnie bardziej pożądane niż kludges, które dodałeś, ponieważ dodają półki, w których pierwsza pochodna oscyluje tam iz powrotem - tego rodzaju rzeczy mają tendencję do tworzenia fikcyjnych fałszywych punktów równowagi lokalnej, jeśli próbujesz zoptymalizować pewną wartość oczekiwaną tej dystrybucja. forma uogólniona złamie symetrię, ale w płynny sposób.

Charlie Strauss
źródło