Przypomnijmy, że funkcjonalną formą regresji logistycznej jest
fa( x ) =11 +mi- (β0+β1x1+ ⋯+βkxk)
Oto, co zwraca predict_proba
.
Termin wewnątrz wykładniczej
re( x ) =β0+β1x1+ ⋯ +βkxk
jest to, co zwraca decision_function
. „Hiperpłaszczyzna”, o której mowa w dokumentacji, to
β0+β1x1+ ⋯ +βkxk= 0
Ta terminologia jest pozostałością po maszynach wektorów nośnych, które dosłownie szacują oddzielającą hiperpłaszczyznę. W przypadku regresji logistycznej hiperpłaszczyzna jest trochę sztuczną konstrukcją, jest to płaszczyzna o równym prawdopodobieństwie, w którym model ustalił, że obie klasy docelowe są jednakowo prawdopodobne.
predict
Zwraca decyzję klasy, stosując regułę
fa( x ) > 0,5
Ryzykując mydelniczką, ta predict
funkcja ma bardzo mało uzasadnionych zastosowań, i uważam, że jest to znak błędu podczas przeglądania innych prac. Zaszedłbym wystarczająco daleko, by nazwać go błędem projektowym w samej sklearn ( predict_proba
funkcja powinna była zostać wywołana predict
i predict
powinna być wywołana predict_class
, jeśli w ogóle).