Przeczytałem artykuł Alexandru Niculescu-Mizila i Richa Caruany „ Uzyskiwanie skalibrowanych prawdopodobieństw od wzmocnienia ” i dyskusję w tym wątku. Jednak nadal mam problemy ze zrozumieniem i wdrożeniem logistyki lub skalowania Platta, aby skalibrować moc wyjściową mojego wieloklasowego klasyfikatora podwyższającego (łagodne przyspieszanie z kikutami decyzyjnymi).
Jestem nieco zaznajomiony z uogólnionymi modelami liniowymi i myślę, że rozumiem, w jaki sposób logistyka i metody kalibracji Platta działają w przypadku binarnym, ale nie jestem pewien, czy wiem, jak rozszerzyć metodę opisaną w artykule na przypadek wielu klas.
Klasyfikator, którego używam, generuje następujące dane:
- = liczba głosów oddanych przez klasyfikatora dla klasy j dla próbki i, która jest klasyfikowana
- = Szacowana klasa
W tym momencie mam następujące pytania:
P1: Czy muszę używać logiki wielomianowej, aby oszacować prawdopodobieństwo? lub czy nadal mogę to zrobić za pomocą regresji logistycznej (np. w trybie 1-vs-all )?
P2: Jak powinienem zdefiniować pośrednie zmienne docelowe (np. Jak w skalowaniu Platta) dla przypadku wielu klas?
P3: Rozumiem, że może to być wiele pytań, ale czy ktoś byłby skłonny naszkicować pseudo-kod tego problemu? (na bardziej praktycznym poziomie interesuje mnie rozwiązanie w Matlabie).
źródło
Odpowiedzi:
Jest to również temat, który mnie interesuje w praktyce, dlatego przeprowadziłem kilka badań. Oto dwa artykuły autora, które są często wymieniane jako odniesienie w tych sprawach.
Istotą zalecanej tutaj techniki jest zredukowanie problemu wieloklasowego do binarnego (np. Jeden kontra reszta, AKA jeden kontra wszystkie), użycie techniki takiej jak Platt (najlepiej przy użyciu zestawu testów) do skalibrowania wyników binarnych / prawdopodobieństw i następnie połącz je za pomocą techniki omówionej w artykułach (jedna jest rozszerzeniem procesu „sprzęgania” Hastie i in.). W pierwszym łączu najlepsze wyniki uzyskano po prostu normalizując binarne prawdopodobieństwa, które sumują się do 1.
Chciałbym usłyszeć inne rady i jeśli którykolwiek z tych tecnhiqes został wprowadzony w R.
źródło