AUC w porządkowej regresji logistycznej

10

Używam 2 rodzajów regresji logistycznej - jeden jest typem prostym do klasyfikacji binarnej, a drugi to porządkowa regresja logistyczna. Do obliczenia dokładności pierwszego użyłem walidacji krzyżowej, w której obliczyłem AUC dla każdego krotności, a następnie obliczyłem średnią AUC. Jak mogę to zrobić dla porządkowej regresji logistycznej? Słyszałem o uogólnionym ROC dla predyktorów wieloklasowych, ale nie jestem pewien, jak to obliczyć.

Dzięki!

Noam Peled
źródło
1
nie AUC, ale powiązane: na krzywych dokładności przywołania mikro / makro na stats.stackexchange.com/questions/21551/…
Jewgienij

Odpowiedzi:

4

Podoba mi się tylko obszar pod krzywą ROC ( -index), ponieważ zdarza się, że jest to prawdopodobieństwo zgodności. jest elementem składowym współczynników korelacji rang. Na przykład Somers ' . Dla porządkowego , jest doskonałą miarą dyskryminacji predykcyjnej, a pakiet R zapewnia łatwy sposób na uzyskanie oszacowań z . Możesz wykonać rozwiązanie wsteczne dla uogólnionego indeksu (uogólnionego AUROC). Istnieją powody, aby nie uwzględniać każdy poziom oddzielnie, ponieważ w ten sposób nie wykorzystać porządkowy charakter .ccDxy=2×(c12)YDxyrmsDxydoYY

W rmssą dwie funkcje: regresji porządkowej lrmi orm, z drugiej manipulacji ciągłym i zapewnia więcej rodzin Funkcje dystrybucji (Link) niż proporcjonalny kursów.Y

Frank Harrell
źródło
Głównym problemem będzie to, w jaki sposób rms oblicza stosowany w Sommer ? do-janremixrexy
Chamberlain Foncha,
1
Jest to pisane Somer's . Uogólniony indeks jest po prostu obliczany przez rozwiązanie równania wymienionego powyżej. Wewnętrznie badane są wszystkie możliwe kombinacje obserwacji o różnych wartościach , a ułamek takich par, dla których prognozy są w tej samej kolejności, jest oszacowaniem prawdopodobieństwa zgodności. Zniekształciłem jedno: funkcja używa Spearmana zamiast . doYormρrexy
Frank Harrell,
Dzięki za korektę pisowni. W regresji porządkowej o wiele bardziej interesujące będzie nie tylko spojrzenie na porządkowanie parami, jak to zrobiono w funkcji orm, o której wspomniałeś, ale także spójne uporządkowanie (z operatorami trójskładnikowymi lub wyższymi) w zależności od liczby posiadanych klas. Podsumowując, mówię: z dopasowaną na przykład skumulowaną regresją logistyczną, porządkowanie klas odbywa się w modelu. Miarą predykcyjną powinna być również możliwość nie wykonania porównania parami ale porównanie postaci $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <oP.(prmire1<prmire2)|obs1<obs2))
Chamberlain Foncha
Nie wiedząc o takich środkach, moją pierwszą reakcją jest to, że stawiają wysoki bar na przeszkodzie.
Frank Harrell,
1

AUC regresji porządkowej jest czymś trudnym. Możesz obliczyć AUC dla każdej klasy, tworząc manekiny, aby przyjąć wartość 1 dla klasy, którą obliczasz AUC i 0 dla pozostałych klas. Jeśli masz 4 klasy, utworzysz 4 AUC i narysujesz je na tym samym wykresie. Głównym problemem związanym z tą metodą jest to, że w równym stopniu karze ona za błędną klasyfikację. Znacznie bardziej intuicyjnie pomijanie klasyfikacji klasy 1 do klasy 3 powinno być gorsze niż pomijanie klasyfikacji klasy 1 do klasy 2.

Chamberlain Foncha
źródło