Biorąc pod uwagę zestaw danych z wynikami binarnymi i pewną macierzą predykcyjną , standardowy model regresji logistycznej szacuje współczynniki które maksymalizują prawdopodobieństwo dwumianowe. Gdy ma pełną pozycję, jest unikalny; gdy nie ma doskonałej separacji, jest skończona.
Czy ten model maksymalnego prawdopodobieństwa maksymalizuje AUC ROC (aka statystyka), czy też istnieje jakiś współczynnik szacunkowy który pozwoli uzyskać wyższą AUC ROC? Jeśli prawdą jest, że MLE niekoniecznie maksymalizuje AUC ROC, to innym sposobem spojrzenia na to pytanie jest: „Czy istnieje alternatywa dla maksymalizacji prawdopodobieństwa, która zawsze maksymalizuje AOC ROC regresji logistycznej?”
Zakładam, że modele są inaczej takie same: nie dodajemy ani nie usuwamy predyktorów w , ani w żaden inny sposób nie zmieniamy specyfikacji modelu, i zakładam, że modele maksymalizujące prawdopodobieństwo i maksymalizujące AUC używają tej samej funkcji łączenia.
źródło
Odpowiedzi:
Nie jest tak, że .βMLE=βAUC
Aby to zilustrować, należy wziąć pod uwagę, że AUC można zapisać jako
Innymi słowy, kolejność prognoz jest jedyną rzeczą, która wpływa na AUC . Nie dotyczy to funkcji prawdopodobieństwa. Załóżmy więc, że jako ćwiczenie mentalne mieliśmy pojedyncze predyktory, aw naszym danych nie widzimy idealnej separacji (tj. jest skończony). Teraz, jeśli weźmiemy po prostu wartość największego predyktora i zwiększymy ją o niewielką kwotę, zmienimy prawdopodobieństwo tego rozwiązania, ale nie zmieni to AUC, ponieważ kolejność powinna pozostać taka sama. Zatem, jeśli stary MLE zmaksymalizował AUC, nadal zmaksymalizuje AUC po zmianie predyktora, ale nie zmaksymalizuje już prawdopodobieństwa.βMLE
Tak więc przynajmniej nie jest tak, że nie jest unikalny; każda która zachowuje porządek szacunków, osiąga dokładnie taki sam AUC. Ogólnie biorąc, ponieważ AUC jest wrażliwe na różne aspekty danych, uważam, że powinniśmy być w stanie znaleźć przypadek, w którym nie maksymalizuje . W rzeczywistości zaryzykuję przypuszczenie, że dzieje się to z dużym prawdopodobieństwem.βAUC β βMLE βAUC
EDYCJA (przenoszenie komentarza do odpowiedzi)
Następnym krokiem jest udowodnienie, że MLE niekoniecznie maksymalizuje AUC (co jeszcze nie zostało udowodnione). Można to zrobić, biorąc coś w rodzaju predyktorów 1, 2, 3, 4, 5, 6, (z ) z wynikami 0, 0, 0, 1, 1, 1, 0. Każda dodatnia wartość zmaksymalizuje AUC (niezależnie od wartości ), ale możemy wybrać wystarczająco duże, aby .x x>6 β x x βMLE<0
źródło