Mam model regresji logistycznej dla wieloklasowej, który podaje
gdzie k to liczba klas theta to parametr do oszacowania j to j-ta klasa Xi to dane treningowe
Cóż, jedna rzecz, której nie dostałem, to dlaczego część mianownika znormalizowała model. Mam na myśli, że prawdopodobieństwo pozostanie między 0 a 1.
Mam na myśli, że jestem przyzwyczajony do regresji logistycznej
Właściwie jestem zdezorientowany w kwestii nominacji. W tym przypadku, ponieważ jest to funkcja sigmoidalna, nigdy nie pozwala, aby wartość była mniejsza niż 0 lub większa niż 1. Ale jestem zdezorientowany w przypadku wielu klas. Dlaczego tak jest
To jest moja referencja https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-F February/ 029738.html . Myślę, że powinno być normalizowanie
źródło
Odpowiedzi:
Twoja formuła jest niepoprawna (górna granica sumy). W regresji logistycznej z klasami ( K > 2 ) w zasadzie tworzysz binarne modele regresji logistycznej K - 1 , w których wybierasz jedną klasę jako odniesienie lub oś przestawną. Zazwyczaj ostatnia klasa K jest wybierana jako punkt odniesienia. Zatem prawdopodobieństwo klasy odniesienia można obliczyć za pomocą P ( y i = K | x i ) = 1 - K - 1 ∑ k = 1 P ( y i = kK. K.> 2 K.- 1 K. Ogólna postać prawdopodobieństwa to P ( y i = k | x i ) = exp ( θ T i x i )
źródło
źródło