W technice redukcji wymiarów, takiej jak analiza głównych składników, LDA itp. Często stosuje się termin rozmaitość. Co to jest różnorodność pod względem nietechnicznym? Jeśli punkt należy do sfery, której wymiar Chcę zmniejszyć, a jeśli nie jest to hałas i i są nieskorelowane, to rzeczywiste punkty byłyby znacznie oddzielone od siebie ze względu na hałas. Dlatego wymagane byłoby filtrowanie szumów. Tak więc redukcja wymiarów byłaby wykonywana dla . Dlatego tutaj i należą do różnych rozmaitości?y x y x z = x + y x y
Pracuję nad danymi chmury punktów, które są często wykorzystywane w wizji robotów; chmury punktów są hałaśliwe z powodu hałasu podczas akwizycji i muszę zmniejszyć hałas przed redukcją wymiarów. W przeciwnym razie otrzymam nieprawidłowe zmniejszenie wymiaru. Czym więc jest tutaj kolektor i czy hałas jest częścią tego samego kolektora, do którego należy ?
źródło
Odpowiedzi:
W kategoriach nietechnicznych kolektor to ciągła struktura geometryczna o skończonym wymiarze: linia, krzywa, płaszczyzna, powierzchnia, kula, piłka, cylinder, torus, „kropelka” ... coś takiego :
Jest to ogólny termin używany przez matematyków do powiedzenia „krzywa” (wymiar 1) lub „powierzchnia” (wymiar 2) lub obiekt 3D (wymiar 3) ... dla dowolnego możliwego skończonego wymiaru . Jednowymiarowy kolektor to po prostu krzywa (linia, okrąg ...). Dwuwymiarowy kolektor jest po prostu powierzchnią (płaszczyzna, kula, torus, cylinder ...). Trójwymiarowy kolektor to „pełny obiekt” (kula, pełny sześcian, przestrzeń 3D wokół nas ...).n
Kolektor jest często opisywany równaniem: zbiór punktów takich jak jest kolorem jednowymiarowym (kołem).x 2 + y 2 = 1( x , y) x2)+ y2)= 1
Kolektor ma wszędzie ten sam wymiar. Na przykład, jeśli dodasz linię (wymiar 1) do kuli (wymiar 2), wynikowa struktura geometryczna nie będzie rozmaitością.
W przeciwieństwie do bardziej ogólnych pojęć przestrzeni metrycznej lub przestrzeni topologicznej, które również mają opisywać naszą naturalną intuicję ciągłego zestawu punktów, rozmaitość ma być czymś prostym lokalnie: jak przestrzeń wektora skończonego wymiaru: . Wyklucza to przestrzenie abstrakcyjne (takie jak przestrzenie o nieskończonym wymiarze), które często nie mają konkretnego geometrycznego znaczenia.Rn
W przeciwieństwie do przestrzeni wektorowej rozmaitości mogą mieć różne kształty. Niektóre rozmaitości można łatwo zwizualizować (kula, kula ...), inne są trudne do wizualizacji, jak butelka Kleina lub prawdziwa płaszczyzna projekcyjna .
W statystykach, uczeniu maszynowym lub ogólnie matematyce słowo „rozmaitość” jest często używane do powiedzenia „jak podprzestrzeń liniowa”, ale być może jest zakrzywione. Za każdym razem, gdy napiszesz równanie liniowe, takie jak: , otrzymasz liniową (afiniczną) podprzestrzeń (tutaj płaszczyznę). Zwykle, gdy równanie jest nieliniowe, jak , jest to rozmaitość (tutaj rozciągnięta kula).x 2 + 2 r 2 + 3 z 2 = 73x+2y−4z=1 x2+2y2+3z2=7
Na przykład „ hipoteza wielorakości ” ML mówi, że „dane wielowymiarowe są punktami w wielowymiarowym kolektorze z dodanym szumem wielowymiarowym”. Można sobie wyobrazić punkty koła 1D z dodanym szumem 2D. Chociaż punkty nie są dokładnie na okręgu, statystycznie spełniają równanie . Okrąg jest podstawową rozmaitością:x2+y2=1
źródło
Kolektor (topologiczny) to przestrzeń która jest:M
(1) „lokalnie” „odpowiednik” dla niektórych . nRn n
„Lokalnie” „równoważność” można wyrazić za pomocą funkcji współrzędnych, , które razem tworzą funkcję „zachowania struktury”, , zwany wykresem .c i : M → R c : M → R nn ci:M→R c:M→Rn
(2) można zrealizować w sposób „zachowujący strukturę” jako podzbiór dla niektórych . (1) (2) N≥nRN N≥n
Zauważ, że aby sprecyzować tutaj „strukturę”, należy zrozumieć podstawowe pojęcia topologii ( def. ), Co pozwala na precyzyjne zdefiniowanie „lokalnego” zachowania, a zatem „lokalnego” powyżej. Kiedy mówię „równoważny”, mam na myśli równoważną strukturę topologiczną ( homeomorficzną ), a kiedy mówię „zachowującą strukturę”, mam na myśli to samo (tworzy równoważną strukturę topologiczną).
Zauważ też, że aby wykonać rachunek różniczkowy , potrzebny jest dodatkowy warunek, który nie wynika z powyższych dwóch warunków, co w zasadzie mówi coś takiego: „wykresy są wystarczająco dobrze zachowane, aby umożliwić nam wykonanie rachunku różniczkowego”. Są to rozmaitości najczęściej stosowane w praktyce. W przeciwieństwie do ogólnych rozmaitości topologicznych , oprócz rachunku różniczkowego umożliwiają także triangulacje , co jest bardzo ważne w aplikacjach takich jak Twoja, w których wykorzystuje się dane chmury punktów .
Zauważ, że nie wszyscy ludzie używają tej samej definicji dla rozmaitości (topologicznej). Kilku autorów określi to jako spełniające tylko warunek (1) powyżej, niekoniecznie także (2). Jednak definicja, która spełnia zarówno (1), jak i (2), jest znacznie lepsza, dlatego jest bardziej przydatna dla praktyków. Można oczekiwać intuicyjnie, że (1) implikuje (2), ale tak naprawdę nie jest.
EDIT: Jeśli jesteś zainteresowany nauką o tym, co dokładnie jest „topologia” jest najważniejszym przykładem topologii zrozumienia jest euklidesowa topologia z . Zostanie to szczegółowo omówione w każdej (dobrej) książce wprowadzającej na temat „prawdziwej analizy” .Rn
źródło
W tym kontekście termin rozmaitość jest dokładny, ale jest niepotrzebnie wysoki. Z technicznego punktu widzenia rozmaitość to dowolna przestrzeń (zbiór punktów o topologii), która jest wystarczająco gładka i ciągła (w sposób, który można z pewnym wysiłkiem uczynić matematycznie dobrze zdefiniowanym).
Wyobraź sobie przestrzeń wszystkich możliwych wartości oryginalnych czynników. Po technice redukcji wymiarów nie wszystkie punkty w tej przestrzeni są osiągalne. Zamiast tego można uzyskać tylko punkty na jakiejś osadzonej podprzestrzeni w tej przestrzeni. Ta osadzona podprzestrzeń spełnia matematyczną definicję rozmaitości. W przypadku techniki liniowej redukcji wymiarów, takiej jak PCA, ta podprzestrzeń jest tylko podprzestrzenią liniową (np. Hiperpłaszczyzną), która jest względnie trywialną rozmaitością. Jednak w przypadku techniki nieliniowej redukcji wymiarów ta podprzestrzeń może być bardziej skomplikowana (np. Zakrzywiona hiper-powierzchnia). Dla celów analizy danych zrozumienie, że są to podprzestrzenie, jest o wiele ważniejsze niż jakiekolwiek wnioski, jakie można wyciągnąć z wiedzy, że spełniają one definicję różnorodności.
źródło