Chciałbym przetestować mój wyszkolony model na niezrównoważonym zbiorze danych. Czy są dostępne algorytmy do generowania danych syntetycznych ze zbilansowanego zbioru danych (spam / nie spam)?
unbalanced-classes
synthetic-data
Stuart Peterson
źródło
źródło
Odpowiedzi:
Wypróbuj SMOTE , który jest algorytmem używanym do nadmiernego próbkowania. Tworzy próbki syntetyczne z klasy, którą chcesz przesadzić z próbkami.
Możesz użyć tego do stworzenia dowolnej liczby potrzebnych próbek.
źródło