Jaki jest najlepszy sposób kategoryzacji podejść opracowanych w celu rozwiązania problemu klasy nierównowagi?
W tym artykule podzielono je na:
- Przetwarzanie wstępne: obejmuje oversampling, undersampling i metody hybrydowe,
- Uczenie wrażliwe na koszty: obejmuje metody bezpośrednie i meta-nauczanie, które to ostatnie dzieli się na progi i pobieranie próbek
- Techniki zestawów: obejmują zestawy wrażliwe na koszty i przetwarzanie danych w połączeniu z uczeniem się zestawów.
Druga klasyfikacja:
- Wstępne przetwarzanie danych: obejmuje zmianę dystrybucji i ważenie przestrzeni danych. Uczenie się w jednej klasie jest uważane za zmianę dystrybucji.
- Metody uczenia się specjalnego
- Prognozowanie Post-processing: obejmuje metodę progową i post-processing wrażliwy na koszty
- Metody hybrydowe:
Trzeci artykuł :
- Metody na poziomie danych
- Metody na poziomie algorytmu
- Metody hybrydowe
Ostatnia klasyfikacja uznaje również dostosowanie produkcji za podejście niezależne.
Z góry dziękuję.
Odpowiedzi:
Moim zdaniem wszystkie trzy kategoryzacje zgadzają się w wielu sprawach. Na przykład wszystkie trzy mają kategorię kroków wstępnego przetwarzania.
Zazwyczaj zgadzam się co do trzeciej kategoryzacji, ponieważ jest ona bardziej ogólna i obejmuje więcej rzeczy.
Jedyne, czego brakuje w pierwszych dwóch artykułach, to etapy przetwarzania końcowego, które, szczerze mówiąc, nie są stosowane w praktyce tak często jak inne.
źródło