To pytanie dotyczy artykułu Różnicowa geometria zakrzywionych rodzin wykładniczych-krzywizny i utraty informacji autorstwa Amari.
Tekst wygląda następująco.
Niech będzie wymiarowym kolektorem rozkładów prawdopodobieństwa z układem współrzędnych , gdzie zakłada się ...n θ = ( θ 1 , … , θ n ) p θ ( x ) > 0
Możemy uznać każdy punkt o a przeprowadzania funkcji z ...S n log p θ ( x ) x
Niech będzie przestrzenią styczną w , która z grubsza jest utożsamiana z linearyzowaną wersją małego sąsiedztwa w . Niech będą naturalną podstawą powiązanego ze skoordynowanym układem ... S n θ θ S n e i ( θ ) , i = 1 , … , n T θ
Ponieważ każdy punkt z niesie funkcję z , naturalne jest, że w reprezentuje funkcjęS n log p θ ( x ) x e i ( θ ) θ e i ( θ ) = ∂
Nie rozumiem ostatniego stwierdzenia. Pojawia się to w sekcji 2 wyżej wymienionego artykułu. W jaki sposób podstawę przestrzeni stycznej określa powyższe równanie? Byłoby pomocne, gdyby ktoś w tej społeczności zaznajomiony z tego rodzaju materiałami mógł mi to pomóc. Dzięki.
Aktualizacja 1:
Chociaż zgadzam się, że (od @aginensky) jeśli są liniowo niezależni, to są również liniowo niezależne, to, w jaki sposób są one członkami przestrzeni stycznej, nie jest bardzo jasne. Jak więc można uznać za podstawę przestrzeni stycznej. Każda pomoc jest mile widziana.∂∂
Aktualizacja 2:
@aginensky: W swojej książce Amari mówi:
Rozważmy przypadek, w którym , zbiór wszystkich (ściśle) pozytywnych miar prawdopodobieństwa na , gdzie traktujemy jako podzbiór . W rzeczywistości jest otwartym podzbiorem przestrzeni afinicznej .X = { x 0 , … , x n } P ( X ) R X = { X | X : X → R } P ( X ) { X | ∑ x X ( x ) = 1 }
Następnie przestrzeń styczna z w każdym miejscu mogą być oczywiście określone liniowymi podprzestrzeń . Dla naturalnej podstawy układu współrzędnych , mamy .S n A 0 = { X | ∑ x X ( x ) = 0 } ∂ θ=(θ1,…,θn)(∂
Następnie weźmy kolejne osadzanie i zidentyfikujmy za pomocą podzbioru z . Wektor styczny jest następnie reprezentowany przez wynik działania na , które oznaczamy przez . W szczególności mamy . Oczywiste jest, że i że S n log S n : = { log p | p ∈ S n } R X X ∈ T p ( S n ) X p ↦ log p X ( e ) ( ∂X(e)=X(x)/p(x), T ( e ) P (Sn)={X(e)| X∈Tp(Sn)}={A∈RX| ∑xA(x)p(x
Moje pytanie: jeśli zarówno i są podstawą przestrzeni stycznej, to czy nie byłoby to sprzeczne z fakt, że i są różne i ?
Wydaje mi się, że istnieje związek między ( ) i . Jeśli możesz to wyjaśnić, byłoby to bardzo pomocne. Możesz dać to jako odpowiedź.
Odpowiedzi:
Moje komentarze są tak długie, że zamieszczam je jako odpowiedź.
Myślę, że pytanie jest w tym momencie bardziej filozoficzne niż matematyczne. Mianowicie, co rozumiesz przez spację, aw tym przypadku rozmaitość? Typowa definicja rozmaitości nie obejmuje osadzenia w przestrzeni afinicznej. To jest podejście „nowoczesne” (150 lat?). Na przykład dla Gaussa kolektor był kolektorem ze specyficznym osadzeniem w określonej przestrzeni afinicznej ( ). Jeśli ktoś ma kolektor z osadzeniem w określonym , to przestrzeń styczna (w dowolnym punkcie kolektora) jest izomorficzna do określonej podprzestrzeni przestrzeni stycznej do w tym punkcie. Zauważ, że przestrzeń styczna do w dowolnym punkcie jest identyfikowana z „tym samym” .Rn Rn Rn Rn Rn
Myślę, że chodzi o to, że w artykule Amari przestrzeń, którą określa jako zawiera pewne „naturalne” osadzenie w przestrzeni afinicznej ze współrzędnymi dla których można rozważyć jako współrzędne w przestrzeni stycznej . Mógłbym dodać, że jest jasne tylko, czy funkcja jest w pewnym sensie „ogólna” - dla zdegenerowanego to się nie powiedzie. Na przykład, jeśli funkcja nie obejmowała wszystkich zmiennych . Najważniejsze jest to, że to osadzenie kolektora w konkretnym , powoduje specyficzną identyfikację przestrzeni stycznej za pomocąSn θi pθ Sn p p θi Rn pθ . Kolejnym jego punktem jest to, że ze względu na właściwości może mapować swój rozmaitość za pomocą funkcji logu na inną przestrzeń afiniczną, w której przestrzeń styczna ma inną identyfikację pod względem nowych współrzędnych (logi i ich pochodne). Następnie mówi, że ze względu na właściwości jego sytuacji dwa rozmaitości są izomorficzne, a mapa indukuje izomorfizm w przestrzeniach stycznych. Prowadzi to do identyfikacji (tj. Izomorfizmu) dwóch przestrzeni stycznych. p
Kluczową ideą jest to, że dwie przestrzenie styczne nie są tymi samymi zbiorami, ale są po ich poprawnej identyfikacji izomorficzne (co w zasadzie jest po grecku „identyczne”). Na przykład, czy grupa wszystkich permutacji to ta sama grupa co grupa wszystkich permutacji ? Jako prosty eksperyment myślowy, rozważ , dodatnie rzeczywiste odwzorowanie na , wszystkie rzeczywiste pod dziennikiem mapy. Wybierz swoją ulubioną liczbę rzeczywistą i zastanów się, jaka mapa znajduje się na przestrzeniach stycznych. Czy w końcu rozumiem twoje pytanie? Zastrzeżenie jest słuszne, a mianowicie, że geometria różnicowa nie jest moim głównym obszarem specjalizacji. Myślę, że mam rację, ale nie wahaj się krytykować lub wciąż kwestionować tę odpowiedź.{1,2,3} {a,b,c} R+ R >0
źródło