W tej chwili prowadzę klasyfikator binarny. Kiedy wykreślam krzywą ROC, na początku uzyskuję dobry skok, a następnie zmienia ona kierunek i przecina przekątną, a następnie oczywiście z powrotem w górę, tworząc krzywą w kształcie litery S.
Jaka może być interpretacja / wyjaśnienie tego efektu?
Dzięki
Odpowiedzi:
Otrzymasz ładny symetryczny wykres ROC tylko wtedy, gdy standardowe odchylenia dla obu wyników są takie same. Jeśli różnią się raczej, możesz uzyskać dokładnie opisany wynik.
Poniższy kod Mathematica to pokazuje. Zakładamy, że cel daje rozkład normalny w przestrzeni odpowiedzi, a hałas również daje rozkład normalny, ale przesunięty. Parametry ROC są określone przez obszar poniżej krzywych Gaussa po lewej lub prawej stronie kryterium decyzyjnego. Różnicowanie tego kryterium opisuje krzywą ROC.
Jest to z jednakowymi odchyleniami standardowymi:
Jest tak z dość wyraźnymi:
lub z kilkoma innymi parametrami do gry:
źródło
Posiadanie ciągu negatywnych wystąpień w części krzywej o wysokim FPR może stworzyć tego rodzaju krzywą. Jest to w porządku, o ile używasz odpowiedniego algorytmu do generowania krzywej ROC.
Warunek, w którym masz zestaw 2 mln punktów, z których połowa jest dodatnia, a połowa ujemna - wszystkie z dokładnie takim samym wynikiem dla twojego modelu jest trudna. Jeśli podczas sortowania punktów na podstawie wyniku (standardowa procedura w wykreślaniu ROC) napotkane zostaną wszystkie negatywne przykłady, spowoduje to, że twoja krzywa ROC pozostanie płaska i przesunie się w prawo. W tym artykule opisano, jak zająć się takimi problemami :
Fawcett | Rysowanie krzywych ROC
źródło
(Odpowiedzi @Sjoerd C. de Vries i @Hrishekesh Ganu są poprawne. Pomyślałem, że mimo to mogę przedstawić pomysły w inny sposób, co może pomóc niektórym osobom).
Możesz uzyskać taki ROC, jeśli Twój model jest źle określony. Rozważ poniższy przykład (zakodowany w
R
), który jest dostosowany do mojej odpowiedzi tutaj: jak użyć wykresów pudełkowych, aby znaleźć punkt, w którym wartości prawdopodobnie będą pochodzić z różnych warunków?Łatwo zauważyć, że czerwony model nie ma struktury danych. Poniżej można zobaczyć, jak wyglądają krzywe ROC:
źródło