Mam problem z klasyfikacją ( klasy), rzędu 100 prawdziwych predyktorów, z których jeden wydaje się mieć znacznie większą moc wyjaśniającą niż jakikolwiek inny. Chciałbym głębiej zapoznać się z efektami innych zmiennych. Jednak standardowe techniki uczenia maszynowego (losowe lasy, maszyny SVM itp.) Wydają się być zatapiane przez jeden silny predyktor i nie dostarczają mi wielu interesujących informacji o innych.
Gdyby to był problem z regresją, po prostu regresowałbym się przeciwko silnemu predyktorowi, a następnie używałbym reszt jako danych wejściowych dla innych algorytmów. Jednak tak naprawdę nie rozumiem, jak to podejście można przełożyć na kontekst klasyfikacji.
Moją instynkt jest taki, że problem ten musi być dość powszechny: czy istnieje standardowa technika radzenia sobie z nim?
źródło