Chciałbym wiedzieć, czy są jakieś / jakieś zalety stosowania próbkowania warstwowego zamiast próbkowania losowego, podczas dzielenia oryginalnego zestawu danych na zestaw szkoleniowy i testowy do klasyfikacji.
Ponadto, czy próbkowanie warstwowe wprowadza więcej uprzedzeń do klasyfikatora niż próbkowanie losowe?
Aplikacja, dla której chciałbym zastosować próbkowanie warstwowe do przygotowania danych, jest klasyfikatorem Random Forests, przeszkolonym na oryginalnego zestawu danych. Przed klasyfikatorem jest także etap generowania próbki syntetycznej (SMOTE [1]), który równoważy wielkość klas.
[1] Chawla, Nitesh V., i in. „ SMOTE: technika nadmiernego próbkowania mniejszości syntetycznej. ” Journal of Artificial Intelligence Research 16 (2002): 321-357.