Powiedzmy, że mam kilka wierszy dotyczących problemu z klasyfikacją:
Gdzie są cechami / predyktorami, a to klasa, do której należy kombinacja cech wiersza.
Wiele kombinacji cech i ich klas jest powtarzanych w zestawie danych, którego używam do dopasowania klasyfikatora. Zastanawiam się tylko, czy dopuszczalne jest usunięcie duplikatów (w zasadzie wykonuję polecenie group by X1 ... XN Y
SQL)? Dzięki.
PS:
Dotyczy to tylko zestawu danych o obecności binarnej, w którym priory klas są dość wypaczone