To bardzo szerokie pytanie, które moim zdaniem nie jest w stanie ująć kompleksowo w jednej odpowiedzi. Dlatego uważam, że korzystniejsze byłoby podanie pewnych wskazówek dotyczących odpowiednich odpowiedzi i / lub zasobów. Właśnie to zrobię, przekazując następujące informacje i moje przemyślenia.
Przede wszystkim powinienem wspomnieć o doskonałym i kompleksowym samouczku na temat zmniejszania wymiarów autorstwa Burgesa (2009) z Microsoft Research. W monografii często porusza aspekty wielowymiarowe danych. Praca ta, odnosząca się do zmniejszenia wymiarów jako zmniejszenia wymiarów , przedstawia teoretyczne wprowadzenie do problemu , sugeruje taksonomię metod zmniejszania wymiarów, obejmujących metody projekcyjne i różnorodne metody modelowania , a także zapewnia przegląd wielu metod w każdej kategorii.
Przeglądane metody „ przewidującej realizacji” obejmują analizę niezależnych składników (ICA) , analizę głównych składników (PCA) i jej odmiany, takie jak PCA jądra i probabilistyczna PCA , analizę korelacji kanonicznej (CCA) i jej odmiana CCA jądra , liniowa analiza dyskryminacyjna (LDA ) , redukcja wymiarów jądra (KDR) i niektóre inne. Te różnorodne metody oceniane obejmują wielowymiarową skalowania (MDS) , a jego punkt MDS zmiana, Isomap , lokalnie liniowa Osadzanieoraz metody graficzne, takie jak Laplacian własne mapy i grupowanie spektralne . Podaję tutaj większość sprawdzonych metod na wypadek, gdyby oryginalna publikacja była dla ciebie niedostępna, albo online (link powyżej), albo offline (referencje).
Istnieje zastrzeżenie dla terminu „kompleksowy”, który zastosowałem do wyżej wymienionej pracy. Chociaż jest on raczej dość kompleksowy, jest on względny, ponieważ niektóre podejścia do redukcji wymiarowości nie są omówione w monografii, w szczególności te skupione na zmiennych nieobserwowalnych (utajonych) . Niektóre z nich są jednak wymienione w odniesieniu do innego źródła - książki o redukcji wymiarów.
Teraz pokrótce omówię kilka węższych aspektów omawianego tematu, odnosząc się do moich odpowiednich lub powiązanych odpowiedzi. Jeśli chodzi o podejście do danych wielowymiarowych typu NN) , proszę zobaczyć moje odpowiedzi tutaj (szczególnie polecam sprawdzić artykuł nr 4 na mojej liście). Jednym z efektów przekleństwa wymiarowości jest to, że dane wielowymiarowe są często rzadkie . Biorąc pod uwagę ten fakt, uważam, że moje odpowiednie odpowiedzi tu i tutaj na temat regresji i PCA dla danych rzadkich i wielowymiarowych mogą być pomocne.
Bibliografia
Burges, CJC (2010). Redukcja wymiarów: wycieczka z przewodnikiem. Podstawy i trendy® w uczeniu maszynowym, 2 (4), 275–365. doi: 10.1561 / 2200000002