Co to jest różnorodność?

28

W technice redukcji wymiarów, takiej jak analiza głównych składników, LDA itp. Często stosuje się termin rozmaitość. Co to jest różnorodność pod względem nietechnicznym? Jeśli punkt należy do sfery, której wymiar Chcę zmniejszyć, a jeśli nie jest to hałas i i są nieskorelowane, to rzeczywiste punkty byłyby znacznie oddzielone od siebie ze względu na hałas. Dlatego wymagane byłoby filtrowanie szumów. Tak więc redukcja wymiarów byłaby wykonywana dla . Dlatego tutaj i należą do różnych rozmaitości?y x y x z = x + y x yxyxyxz=x+yxy

Pracuję nad danymi chmury punktów, które są często wykorzystywane w wizji robotów; chmury punktów są hałaśliwe z powodu hałasu podczas akwizycji i muszę zmniejszyć hałas przed redukcją wymiarów. W przeciwnym razie otrzymam nieprawidłowe zmniejszenie wymiaru. Czym więc jest tutaj kolektor i czy hałas jest częścią tego samego kolektora, do którego należy ?x

Ria George
źródło
4
Właściwie nie jest możliwe prawidłowe użycie tego terminu bez precyzji matematycznej
Chill2Macht

Odpowiedzi:

45

W kategoriach nietechnicznych kolektor to ciągła struktura geometryczna o skończonym wymiarze: linia, krzywa, płaszczyzna, powierzchnia, kula, piłka, cylinder, torus, „kropelka” ... coś takiego : wprowadź opis zdjęcia tutaj

Jest to ogólny termin używany przez matematyków do powiedzenia „krzywa” (wymiar 1) lub „powierzchnia” (wymiar 2) lub obiekt 3D (wymiar 3) ... dla dowolnego możliwego skończonego wymiaru . Jednowymiarowy kolektor to po prostu krzywa (linia, okrąg ...). Dwuwymiarowy kolektor jest po prostu powierzchnią (płaszczyzna, kula, torus, cylinder ...). Trójwymiarowy kolektor to „pełny obiekt” (kula, pełny sześcian, przestrzeń 3D wokół nas ...).n

Kolektor jest często opisywany równaniem: zbiór punktów takich jak jest kolorem jednowymiarowym (kołem).x 2 + y 2 = 1(x,y)x2+y2=1

Kolektor ma wszędzie ten sam wymiar. Na przykład, jeśli dodasz linię (wymiar 1) do kuli (wymiar 2), wynikowa struktura geometryczna nie będzie rozmaitością.

W przeciwieństwie do bardziej ogólnych pojęć przestrzeni metrycznej lub przestrzeni topologicznej, które również mają opisywać naszą naturalną intuicję ciągłego zestawu punktów, rozmaitość ma być czymś prostym lokalnie: jak przestrzeń wektora skończonego wymiaru: . Wyklucza to przestrzenie abstrakcyjne (takie jak przestrzenie o nieskończonym wymiarze), które często nie mają konkretnego geometrycznego znaczenia.Rn

W przeciwieństwie do przestrzeni wektorowej rozmaitości mogą mieć różne kształty. Niektóre rozmaitości można łatwo zwizualizować (kula, kula ...), inne są trudne do wizualizacji, jak butelka Kleina lub prawdziwa płaszczyzna projekcyjna .

W statystykach, uczeniu maszynowym lub ogólnie matematyce słowo „rozmaitość” jest często używane do powiedzenia „jak podprzestrzeń liniowa”, ale być może jest zakrzywione. Za każdym razem, gdy napiszesz równanie liniowe, takie jak: , otrzymasz liniową (afiniczną) podprzestrzeń (tutaj płaszczyznę). Zwykle, gdy równanie jest nieliniowe, jak , jest to rozmaitość (tutaj rozciągnięta kula).x 2 + 2 r 2 + 3 z 2 = 73x+2y4z=1x2+2y2+3z2=7

Na przykład „ hipoteza wielorakości ” ML mówi, że „dane wielowymiarowe są punktami w wielowymiarowym kolektorze z dodanym szumem wielowymiarowym”. Można sobie wyobrazić punkty koła 1D z dodanym szumem 2D. Chociaż punkty nie są dokładnie na okręgu, statystycznie spełniają równanie . Okrąg jest podstawową rozmaitością: x2+y2=1https://i.stack.imgur.com/iEm2m.png

Benoit Sanchez
źródło
4
@RiaGeorge Na zdjęciu powierzchnia jest kolektorem. To ciągły, ponieważ można nim swobodnie poruszać się bez przerwy i nigdy nie musiał skakać poza powierzchnię dostać pomiędzy dowolnymi dwoma miejscami. Otwory, o których się wspominasz, są ważne w opisywaniu, jak najprościej omijać powierzchnię między dowolnymi dwoma punktami, a ich liczenie jest ważną techniką w badaniu różnorodności.
Matthew Drury
4
Wyjaśnienie, czym jest topologia, byłoby zbyt szerokim pytaniem dla tej witryny i nieco nie na temat. Szukałem informacji na temat wymiany stosów matematycznych. Kolektory i topologia nie są synonimami: rozmaitości są obiektami matematycznymi badanymi za pomocą technik topologii, topologia jest przedmiotem badań matematycznych.
Matthew Drury
1
Odpowiedź nie uwzględnia wszystkich zasadniczych punktów, które sprawiają, że jest ona tak różnorodna, że ​​nie rozumiem, dlaczego ma tak wiele pozytywnych opinii. Topologia, wykresy i gładkość nawet nie wspomniano, a odpowiedź w zasadzie daje wrażenie, że kolektor jest powierzchnia, która jest nie .
gented
2
Punkt techniczny, zestaw rozwiązań układu równań nie musi być różnorodny. Jest to różnorodność, więc najczęściej jest różnorodna, ale może mieć punkty przecięcia się, w których zawodzi różnorodna właściwość.
Matt Samuel
1
Twoja różnorodna definicja obejmuje wymóg skończonego wymiaru . Ale podajesz przykłady, które nie spełniają tego wymagania - takie jak linie, płaszczyzny, krzywe i powierzchnie. Czy możesz wyjaśnić, co miałeś na myśli?
Mowzer,
13

Kolektor (topologiczny) to przestrzeń która jest:M

(1) „lokalnie” „odpowiednik” dla niektórych . nRnn

„Lokalnie” „równoważność” można wyrazić za pomocą funkcji współrzędnych, , które razem tworzą funkcję „zachowania struktury”, , zwany wykresem .c i : M R c : M R nnci:MRc:MRn

(2) można zrealizować w sposób „zachowujący strukturę” jako podzbiór dla niektórych . (1) (2) NnRNNn

Zauważ, że aby sprecyzować tutaj „strukturę”, należy zrozumieć podstawowe pojęcia topologii ( def. ), Co pozwala na precyzyjne zdefiniowanie „lokalnego” zachowania, a zatem „lokalnego” powyżej. Kiedy mówię „równoważny”, mam na myśli równoważną strukturę topologiczną ( homeomorficzną ), a kiedy mówię „zachowującą strukturę”, mam na myśli to samo (tworzy równoważną strukturę topologiczną).

Zauważ też, że aby wykonać rachunek różniczkowy , potrzebny jest dodatkowy warunek, który nie wynika z powyższych dwóch warunków, co w zasadzie mówi coś takiego: „wykresy są wystarczająco dobrze zachowane, aby umożliwić nam wykonanie rachunku różniczkowego”. Są to rozmaitości najczęściej stosowane w praktyce. W przeciwieństwie do ogólnych rozmaitości topologicznych , oprócz rachunku różniczkowego umożliwiają także triangulacje , co jest bardzo ważne w aplikacjach takich jak Twoja, w których wykorzystuje się dane chmury punktów .

Zauważ, że nie wszyscy ludzie używają tej samej definicji dla rozmaitości (topologicznej). Kilku autorów określi to jako spełniające tylko warunek (1) powyżej, niekoniecznie także (2). Jednak definicja, która spełnia zarówno (1), jak i (2), jest znacznie lepsza, dlatego jest bardziej przydatna dla praktyków. Można oczekiwać intuicyjnie, że (1) implikuje (2), ale tak naprawdę nie jest.

EDIT: Jeśli jesteś zainteresowany nauką o tym, co dokładnie jest „topologia” jest najważniejszym przykładem topologii zrozumienia jest euklidesowa topologia z . Zostanie to szczegółowo omówione w każdej (dobrej) książce wprowadzającej na temat „prawdziwej analizy” .Rn

Chill2Macht
źródło
Dziękuję za odpowiedź: czy możesz wyjaśnić, czym jest topologia również pod względem nietechnicznym? Czy termin topologia i rozmaitość są używane zamiennie? Czy wymiar musi być liczbą całkowitą? Co to jest liczba rzeczywista, to myślę, że struktura jest znana jako fraktale, jeśli cała struktura składa się z każdej podsekcji jest powtarzalna.
Ria George,
1
@RiaGeorge oznacza liczbę naturalną (całkowita ), tak samo jak . Być może istnieje bardziej zaawansowana teoria wymiarów ułamkowych / o wartościach rzeczywistych, ale nie pojawia się ona tak często. „Topologia” i „różnorodność” oznaczają dwie bardzo różne rzeczy, więc nie są to terminy wymienne. „Kolektor” ma „topologię”. Pole Topologia bada przestrzenie, które mają „topologie”, czyli zbiory zbiorów spełniające trzy reguły / warunki. Jednym z celów badania „topologii” jest opisanie w spójny i odtwarzalny sposób pojęć „lokalnego” zachowania. 1 N.n1N
Chill2Macht
@RiaGeorge Aksjomaty „topologii” można znaleźć na stronie Wikipedii: en.wikipedia.org/wiki/General_topology#A_topology_on_a_set - zwróć też uwagę, że podałem ci link do (równoważnej) definicji „topologii” w kategoriach sąsiedztwa wskazywało na coś spokrewnionego, ale nie tego samego, zredagowałem moją odpowiedź, aby to odzwierciedlić: en.wikipedia.org/wiki/... Zauważ jednak, że definicja dzielnic jest trudniejsza do zrozumienia (wyobrażam sobie, że mogłem to zrozumieć cóż, ale też nie przeszkadzam, bo jestem leniwy
Chill2Macht
więc w każdym razie moim osobistym uprzedzeniem jest to, że nie trzeba znać definicji topologii sąsiedztwa - wystarczy wiedzieć, że prostsza definicja daje taką samą moc definicji sąsiedztwa w zakresie rygorystycznego opisu zachowania lokalnego, ponieważ są one odpowiednik). W każdym razie, jeśli interesują Cię fraktale, być może te strony w Wikipedii będą dla ciebie interesujące - nie mogę ci w tym więcej pomóc, ponieważ nie jestem do końca zaznajomiony z teorią i nie znam ani nie rozumiem większości definicje - słyszałem tylko o niektórych
Chill2Macht
1
To jedyna jak dotąd odpowiedź, która zwraca uwagę na nowoczesną matematyczną ideę złożenia globalnego obiektu z danych lokalnych. Niestety nie osiąga poziomu prostoty i przejrzystości wymaganego od konta „nietechnicznego”.
whuber
9

W tym kontekście termin rozmaitość jest dokładny, ale jest niepotrzebnie wysoki. Z technicznego punktu widzenia rozmaitość to dowolna przestrzeń (zbiór punktów o topologii), która jest wystarczająco gładka i ciągła (w sposób, który można z pewnym wysiłkiem uczynić matematycznie dobrze zdefiniowanym).

Wyobraź sobie przestrzeń wszystkich możliwych wartości oryginalnych czynników. Po technice redukcji wymiarów nie wszystkie punkty w tej przestrzeni są osiągalne. Zamiast tego można uzyskać tylko punkty na jakiejś osadzonej podprzestrzeni w tej przestrzeni. Ta osadzona podprzestrzeń spełnia matematyczną definicję rozmaitości. W przypadku techniki liniowej redukcji wymiarów, takiej jak PCA, ta podprzestrzeń jest tylko podprzestrzenią liniową (np. Hiperpłaszczyzną), która jest względnie trywialną rozmaitością. Jednak w przypadku techniki nieliniowej redukcji wymiarów ta podprzestrzeń może być bardziej skomplikowana (np. Zakrzywiona hiper-powierzchnia). Dla celów analizy danych zrozumienie, że są to podprzestrzenie, jest o wiele ważniejsze niż jakiekolwiek wnioski, jakie można wyciągnąć z wiedzy, że spełniają one definicję różnorodności.

David Wright
źródło
3
„Highfalutin” ... nauczył się dzisiaj nowego słowa!
Mehrdad
5
Matematycznie rozmaitość to dowolna lokalnie ciągła przestrzeń topologiczna. Podoba mi się pomysł wyjaśnienia rzeczy prostym językiem, ale ta charakterystyka naprawdę nie działa. Po pierwsze, ciągłość jest zawsze lokalną własnością, więc nie jestem pewien, co rozumiesz przez lokalnie ciągłe. Ponadto twoja definicja nie wyklucza wielu rzeczy, które nie są rozmaitościami, takich jak racjonalna linia liczbowa lub połączenie dwóch przecinających się linii na płaszczyźnie euklidesowej.
Ben Crowell,
4
Zgadzam się z Benem, technicznie rzecz biorąc, jest to „lokalnie euklidesowy”. Nie jestem pewien, czy istnieje dobry sposób na sprowadzenie tego do prostego angielskiego.
Matthew Drury
1
Muszę również zdecydowanie się zgodzić z powyższymi dwoma komentarzami. W rzeczywistości odpowiedź, którą napisałem poniżej, pierwotnie miała być komentarzem wyjaśniającym do tej odpowiedzi, która stała się zbyt długa. Nie ma dokładnego pojęcia „ciągłej” przestrzeni topologicznej (patrz tutaj: math.stackexchange.com/questions/1822769/… ). Zdefiniowanie rozmaitości w kategoriach nieistniejących pojęć jest, moim zdaniem, na dłuższą metę bardziej prawdopodobne, że będzie mylące niż wyjaśniające. Przynajmniej sugerowałbym zastąpienie słowa „matematycznie” w pierwszym zdaniu czymś innym.
Chill2Macht
Wykorzystam ten komentarz jako okazję, by zadać małe pytanie ... Myślę (że) wpadłem na pomysł rozmaitości, ale dlaczego jest to potrzebne "lokalnie"? Czy przestrzeń nie jest „lokalnie” ciągła… ciągła jako całość?
Paul92