Ponieważ regresja logistyczna jest statystycznym modelem klasyfikacji zajmującym się zmiennymi zależnymi kategorycznie, dlaczego nie nazywa się to klasyfikacją logistyczną ? Czy nazwa „regresji” nie powinna być zarezerwowana dla modeli zajmujących się ciągłymi zmiennymi zależnymi?
regression
machine-learning
logistic
classification
terminology
Ismael Ghalimi
źródło
źródło
Odpowiedzi:
Regresja logistyczna zdecydowanie nie jest algorytmem klasyfikacji. Jest to tylko algorytm klasyfikacji w połączeniu z regułą decyzyjną, która czyni dychotomią przewidywane prawdopodobieństwo wyniku. Regresja logistyczna jest modelem regresji, ponieważ szacuje prawdopodobieństwo przynależności do klasy jako (transformacja) funkcji wieloliniowej cech.
Frank Harrell opublikował wiele odpowiedzi na tej stronie, wyliczając pułapki związane z uznaniem regresji logistycznej za algorytm klasyfikacji. Pomiędzy nimi:
Jeśli dobrze pamiętam, kiedyś wskazał mi swoją książkę na temat strategii regresji, aby rozwinąć te (i więcej!) Punkty, ale wydaje mi się, że nie mogę znaleźć tego konkretnego postu.
źródło
Abstrakcyjnie regresja jest problemem obliczania warunkowego oczekiwania . Forma przyjęta przez to oczekiwanie różni się w zależności od założeń dotyczących sposobu generowania danych:E[Y|X=x]
Termin „regresja” został również użyty bardziej ogólnie, w tym podejścia takie jak regresja kwantyli, która szacuje dane kwantyle .(Y|X=x)
źródło
Oprócz podanych już dobrych odpowiedzi, innym poglądem jest to, że regresja logistyczna przewiduje prawdopodobieństwa (które są wartością ciągłą ), które mają zakres od 0 do 1.
źródło