Chcę modelować regresję logistyczną z niezrównoważonymi danymi (9: 1). Chciałem wypróbować opcję wag w glm
funkcji w R, ale nie jestem w 100% pewien, co ona robi.
Powiedzmy, że moja zmienna wyjściowa to c(0,0,0,0,0,0,0,0,0,1)
. teraz chcę nadać „1” 10-krotnie większą wagę. więc podaję argument wagi weights=c(1,1,1,1,1,1,1,1,1,1,1,10)
.
Gdy to zrobię, zostanie to wzięte pod uwagę przy obliczaniu maksymalnego prawdopodobieństwa. Czy mam rację? błędna klasyfikacja „1” jest tylko 10 razy gorsza niż błędne sklasyfikowanie „0”.