1) Jak mogę zmienić próg klasyfikacji (domyślnie jest to 0,5) w RandomForest w sklearn?
2) Jak mogę zaniżać próbkę w sklearn?
3) Mam następujący wynik z klasyfikatora RandomForest: [[1635 1297] [520 3624]]
precision recall f1-score support
class 0 0.76 0.56 0.64 2932
class 1 0.74 0.87 0.80 4144
śr. / ogółem 0,75 0,74 0,73 7076
po pierwsze, dane są niezrównoważone (30% z klasy 0 i 70% z klasy 1). Sądzę więc, że bardziej prawdopodobne jest, że klasyfikator będzie stronniczy w przypadku klasy 1, co oznacza przesunięcie niektórych z klasy 0 do klasy 1 (istnieje 1297 błędnych klasyfikacji dla klasy 0, ale 520 błędnych dla klasy 1). Jak mogę to naprawić? czy próbkowanie w dół może pomóc? czy zmieniasz próg klasyfikacji?
Aktualizacja: klasa 0 ma 40% populacji, podczas gdy klasa 1 wynosi 60%. Jednak dryf z klasy 0 do klasy 1 (1297) jest wysoki, podczas gdy chcę, aby był niski.
źródło
sample_weight
parametr (jedna waga na parametr), który jest bardzo elastyczny i umożliwia symulacjęclass_weight
(jedna waga na klasę docelową).y
? Dlaczego masz inneY
iy
?