Regresja logistyczna - obawy / pułapki związane z wielokoliniowością

16

Czy w logistycznej regresji trzeba być tak samo zaniepokojonym wielokoliniowością, jak w przypadku regresji OLS?

Na przykład, w przypadku regresji logistycznej, w której występuje wielokoliniowość, czy trzeba być ostrożnym (podobnie jak w przypadku regresji OLS) przy wyciąganiu wniosków ze współczynników Beta?

W przypadku regresji OLS jedną „poprawką” wysokiej wielokoliniowości jest regresja kalenicowa, czy istnieje coś takiego w regresji logistycznej? Również upuszczanie zmiennych lub łączenie zmiennych.

Jakie podejścia są uzasadnione w celu zmniejszenia skutków wielokoliniowości w regresji logistycznej? Czy są zasadniczo takie same jak OLS?

(Uwaga: nie jest to do celów zaprojektowanego eksperymentu)

Brandon Bertelsen
źródło

Odpowiedzi:

16

Wszystkie te same zasady dotyczące wielokoliniowości dotyczą regresji logistycznej, jak w przypadku OLS. Można zastosować tę samą diagnostykę oceniającą wielokoliniowość (np. VIF, numer warunku, regresje pomocnicze) i zastosować te same techniki redukcji wymiarów (takie jak łączenie zmiennych za pomocą analizy głównych składników).

Ta odpowiedź autorstwa chl doprowadzi cię do niektórych zasobów i pakietów R do dopasowania karanych modeli logistycznych (a także do dobrej dyskusji na temat tego rodzaju procedur regresji karnej). Ale niektóre z twoich komentarzy na temat „rozwiązań” multikolinearności są dla mnie trochę niepokojące. Jeśli zależy ci tylko na oszacowaniu zależności dla zmiennych, które nie są współliniowe, te „rozwiązania” mogą być w porządku, ale jeśli jesteś zainteresowany oszacowaniem współczynników zmiennych, które są współliniowe, te techniki nie rozwiążą twojego problemu. Chociaż problem wielokoliniowości jest techniczny, ponieważ nie można odwrócić macierzy zmiennych predykcyjnych, ma ona logiczny analog, ponieważ predyktory nie są niezależne, a ich skutków nie można jednoznacznie zidentyfikować.

Andy W.
źródło
2
(+1) Tak, istnieją pewne karać wersje regresji logistycznej (lub, bardziej ogólnie, GLMs), zobaczyć kilka odniesień tam: stats.stackexchange.com/questions/4272/... .
chl
@chl, dziękuję. Zaktualizowałem link do twojej poprzedniej odpowiedzi.
Andy W
Dziękuję też. To był tylko komentarz do twojej i tak doskonałej odpowiedzi.
chl