Czy są jakieś prace / książki / pomysły na temat związku między liczbą cech a liczbą obserwacji, które należy przeprowadzić, aby wyszkolić „solidnego” klasyfikatora?
Załóżmy na przykład, że mam 1000 cech i 10 obserwacji z dwóch klas jako zestaw treningowy i 10 innych obserwacji jako zestaw testowy. Trenuję jakiś klasyfikator X, który daje mi 90% czułości i 90% swoistości na zestawie testowym. Powiedzmy, że jestem zadowolony z tej dokładności i na tej podstawie mogę powiedzieć, że jest to dobry klasyfikator. Z drugiej strony aproksymowałem funkcję 1000 zmiennych przy użyciu tylko 10 punktów, co może wydawać się mało ... solidne?