To pytanie jest nieco niechlujne, ale w celu uzupełnienia tego uwzględnię kolorowe wykresy! Najpierw tło, a następnie pytanie.
tło
Załóżmy, że masz wymiarowy rozkład wielomianowy z jednakowymi probailitami w kategoriach . Niech będzie znormalizowanymi ( ) z tego rozkładu, to znaczy:
Teraz rozkład w ma obsługę -simplex, ale z dyskretnymi krokami. Na przykład przy ten rozkład ma następujące wsparcie (czerwone kropki):
Innym rozkładem o podobnym wsparciu jest rozkład -dimensional , czyli równomierny rozkład w jednostce jednostronnej. Na przykład tutaj losowe losowania z 3-dimeional :Dirichlet ( 1 , … , 1 ) Dirichlet ( 1 , 1 , 1 )
Teraz wpadłem na pomysł, że rozkład z rozkładu można scharakteryzować jako czerpanie z które są dyskretne do dyskretnej obsługi . Dyskretyzacja, o której myślałem (i wydaje się, że działa dobrze), polega na uwzględnieniu każdego punktu w jednostce drukowanej i „zaokrągleniu” do najbliższego punktu, który jest . W przypadku trójwymiarowego simpleksu otrzymujesz następującą partycję, w której punkty w każdym kolorowym obszarze powinny „zaokrąglić” do najbliższego czerwonego punktu:Wielomianowe ( 1 / n , … , 1 / n ) Dirichlet ( 1 , … , 1 ) π π
Ponieważ rozkład Dirichleta jest jednolity, wynikowa gęstość / prawdopodobieństwo dla każdego z punktów jest proporcjonalne do powierzchni / objętości, która zostaje „zaokrąglona” do każdego punktu. Dla przypadków dwuwymiarowych i trójwymiarowych prawdopodobieństwa te są następujące:
( te prawdopodobieństwa pochodzą z symulacji Monte Carlo )
Wydaje się więc, że przynajmniej dla 2 i 3 wymiarów wynikowy rozkład prawdopodobieństwa z dyskretyzacji w ten konkretny sposób jest taki sam jak rozkład prawdopodobieństwa dla . Jest to znormalizowany wynik dystrybucji . Próbowałem również z 4-wymiarami i wydaje się, że tam działa.π Wielomian ( 1 / n , … , 1 / n )
Pytania)
Więc moje główne pytanie brzmi:
Czy dyskretyzując jednolity Dirichlet w ten konkretny sposób, czy relacja z dla dalszych wymiarów? Czy relacja w ogóle się utrzymuje? (Próbowałem tego tylko przy użyciu symulacji Monte Carlo ...)
Dalej zastanawiam się:
- Jeśli ta relacja się utrzymuje, czy jest to znany wynik? Czy jest jakieś źródło, które mogę zacytować?
- Jeśli ta dyskretyzacja jednolitego Dirichleta nie ma tego związku z Wielomianem. Czy istnieje jakaś podobna konstrukcja?
Jakiś kontekst
Moim powodem zadania tego pytania jest to, że patrzę na podobieństwo między nieparametrycznym Bootstrapem a Bayesowskim Bootstrapem, a potem to się pojawiło. Zauważyłem również, że wzór na kolorowych obszarach na trójwymiarowym simpleksie powyżej wygląda (i powinien być) diagram Voronoi. Jednym ze sposobów (mam nadzieję), że można o tym pomyśleć, jest sekwencja trójkąta Pascala / Simpexa ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Tam, gdzie rozmiar kolorowych obszarów jest zgodny z drugim rzędem trójkąta Pascala w przypadku 2-d, trzeci rząd czworościanu Pascala w przypadku 3-d i tak dalej. To wyjaśniałoby związek z rozkładem wielomianowym, ale tutaj jestem naprawdę w głębokiej wodzie ...
źródło
Odpowiedzi:
Te dwie dystrybucje są różne dla każdego .n≥4
Notacja
Zamienię przeskalować twój simpleks o współczynnik , aby punkty sieci miały współrzędne całkowite. To nic nie zmienia, myślę, że to sprawia, że notacja jest nieco mniej kłopotliwa.n
Niech będzie prostym , podanym jako wypukły kadłub punktów , ..., w . Innymi słowy, są to punkty, w których wszystkie współrzędne są nieujemne, i gdzie współrzędne sumują się do .( n - 1 ) ( n , 0 , … , 0 ) ( 0 , … , 0 , n ) R n nS (n−1) (n,0,…,0) (0,…,0,n) Rn n
Niech oznacza zbiór punktów sieci , tj. Te punkty w których wszystkie współrzędne są integralne.S.Λ S
Jeśli jest punktem sieci, pozwalamy oznaczać jego komórkę Voronoi , zdefiniowaną jako te punkty w które są (ściśle) bliższe niż do dowolnego innego punktu w .V P S P ΛP VP S P Λ
Umieszczamy dwa rozkłady prawdopodobieństwa, które możemy umieścić na . Jednym z nich jest rozkład wielomianowy, w którym punkt ma prawdopodobieństwo . Drugi nazwiemy modelem Dirichleta i przypisuje on każdemu prawdopodobieństwo proporcjonalne do objętości .( 1 , . . . , N ) 2 - N N ! / ( a 1 ! ⋯ a n ! ) P ∈ Λ V PΛ (a1,...,an) 2−nn!/(a1!⋯an!) P∈Λ VP
Bardzo nieformalne uzasadnienie
Twierdzę, że model wielomianowy i model Dirichleta dają różne rozkłady w , ilekroć .n ≥ 4Λ n≥4
Aby to zobaczyć, rozważ przypadek , a punkty i . Twierdzę, że i są przystające poprzez tłumaczenie przez wektor . Oznacza to, że i mają tę samą objętość, a zatem że i mają takie samo prawdopodobieństwo w modelu Dirichleta. Z drugiej strony w modelu wielomianowym mają różne prawdopodobieństwa ( I ), I to wynika z tego, że rozkłady nie mogą być równe.A = ( 2 , 2 , 0 , 0 ) B = ( 3 , 1 , 0 , 0 ) V A V B ( 1 , - 1 , 0 , 0 ) V A V B A B 2 - 4 ⋅ 4 ! / ( 2 ! 2 ! ) 2 - 4n=4 A=(2,2,0,0) B=(3,1,0,0) VA VB (1,−1,0,0) VA VB A B 2−4⋅4!/(2!2!) 2−4⋅4!/3!
Fakt, że i są zgodne, wynika z następującego prawdopodobnego, ale nieoczywistego (i nieco niejasnego) twierdzenia:V BVA VB
Możliwe twierdzenie : Na kształt i rozmiar wpływ mają tylko „bezpośredni sąsiedzi” (tj. Te punkty w które różnią się od przez wektor, który wygląda jak , gdzie i mogą znajdować się w innych miejscach) P Λ P ( 1 , - 1 , 0 , … , 0 ) 1 - 1VP P Λ P (1,−1,0,…,0) 1 −1
Łatwo zauważyć, że konfiguracje „bezpośrednich sąsiadów” i są takie same, a następnie wynika, że i są przystające.B V A V BA B VA VB
W przypadku, gdy , możemy grać w tę samą grę, z i , na przykład.A = ( 2 , 2 , n - 4 , 0 , … , 0 ) B = ( 3 , 1 , n - 4 , 0 , … , 0 )n≥5 A=(2,2,n−4,0,…,0) B=(3,1,n−4,0,…,0)
Nie sądzę, że to twierdzenie jest całkowicie oczywiste i nie zamierzam tego udowodnić, zamiast nieco innej strategii. Myślę jednak, że jest to bardziej intuicyjna odpowiedź na pytanie, dlaczego rozkłady są różne dla .n≥4
Rygorystyczny dowód
Weź i jak w powyższym nieformalnym uzasadnieniu. Musimy tylko udowodnić, że i są zgodne.B V A V BA B VA VB
Biorąc pod uwagę , zdefiniujemy w następujący sposób: jest zbiorem punktów , dla których . (W bardziej przyswajalny sposób: Niech . jest zbiorem punktów, dla których różnica między najwyższym i najniższym jest mniejsza niż 1.)W P W P ( x 1 , … , x n ) ∈ S max 1 ≤ i ≤ n ( a i - p i ) - min 1 ≤ i ≤ n ( a i - p i ) < 1 v i = aP=(p1,…,pn)∈Λ WP WP (x1,…,xn)∈S max1≤i≤n(ai−pi)−min1≤i≤n(ai−pi)<1 W P v ivi=ai−pi WP vi
Pokażemy, że .VP=WP
Krok 1
Roszczenie: .VP⊆WP
Jest to dość łatwe: Załóżmy, że nie ma w . Niech i załóżmy (bez utraty ogólności), że , . Ponieważ , wiemy również, że .W P v i = x i - p i v 1 = max 1 ≤ i ≤ n v i v 2 = min 1 ≤ i ≤ n v i v 1 - v 2 ≥ 1 ∑ n i = 1 v i = 0 v 1X=(x1,…,xn) WP vi=xi−pi v1=max1≤i≤nvi v2=min1≤i≤nvi v1−v2≥1 ∑ni=1vi=0 v1>0>v2
Niech teraz . Ponieważ zarówno i mają nieujemne współrzędne, podobnie , i wynika z tego, że , a więc . Z drugiej strony, . Zatem jest co najmniej tak blisko jak , więc . To pokazuje (przyjmując uzupełnienia), że .P X Q Q ∈ S Q ∈ Λ d i s t 2 ( X , P ) - d i s t 2 ( X , Q ) = v 2 1 + v 2 2 - (Q=(p1+1,p2−1,p3,…,pn) P X Q Q∈S Q∈Λ X Q P X ∉ V P V p ⊆ W Pdist2(X,P)−dist2(X,Q)=v21+v22−(1−v1)2−(1+v2)2=−2+2(v1−v2)≥0 X Q P X∉VP Vp⊆WP
Krok 2
Twierdzenie : są rozłączne parami.WP
Załóżmy inaczej. Niech i będą odrębnymi punktami w i niech . Ponieważ i są różne i oba w , musi istnieć jeden indeks gdzie , i jeden, gdzie . Bez utraty ogólności przyjmujemy, że i . Ponownie rozmieszczając i dodając, otrzymujemy .Q = ( q 1 , … , q n ) Λ X ∈ W P ∩ W Q P Q Λ i p i ≥ q i + 1 p i ≤ q i - 1 p 1 ≥ q 1 + 1 p 2 ≤ q 2 -P=(p1,…,pn) Q=(q1,…,qn) Λ X∈WP∩WQ P Q Λ i pi≥qi+1 pi≤qi−1 p1≥q1+1 q 1 - p 1 + p 2 - q 2 ≥ 2p2≤q2−1 q1−p1+p2−q2≥2
Rozważ teraz liczby i . Z faktu, że , mamy . Podobnie oznacza, że . Łącząc je, otrzymujemy , i mamy sprzeczność.x 2 X ∈ W P x 1 - p 1 - ( x 2 - p 2 ) < 1 X ∈ W Q x 2 - q 2 - ( x 1 - q 1 ) < 1 q 1 - p 1 + p 2 - q 2 < 2x1 x2 X∈WP x1−p1−(x2−p2)<1 X∈WQ x2−q2−(x1−q1)<1 q1−p1+p2−q2<2
Krok 3
Wykazaliśmy, że i że są rozłączne. pokrywa do zestawu miary zero, i stąd, że (do zestawu środka zero). [Ponieważ zarówno i są otwarte, faktycznie mamy dokładnie , ale nie jest to konieczne.]W P V P S W P = V P W P V P W P = V PVP⊆WP WP VP S WP=VP WP VP WP=VP
Teraz już prawie skończyliśmy. Rozważ punkty i . Łatwo zauważyć, że i są przystające i tłumaczą się nawzajem: jedynym sposobem, w jaki mogą się różnić, jest to, że granica (inna niż twarze, na których leżą obie i ) `` odcina się '' albo lub ale nie drugiej. Ale aby osiągnąć taką część granicy , musielibyśmy zmienić jedną współrzędną lub o co najmniej 1, co wystarczyłoby, aby zagwarantować nam wyprowadzenie zA=(2,2,n−4,0,…,0) B=(3,1,n−4,0,…,0) WA WB S A B WA WB S A B WA i tak. Tak więc, chociaż wygląda inaczej niż punkty obserwacyjne i , różnice są zbyt daleko, aby można je było w definicjach i , a zatem i są przystające.WB S A B WA WB WA WB
Wynika z tego, że i mają tę samą objętość, a zatem model Dirichleta przypisuje im takie samo prawdopodobieństwo, mimo że mają różne prawdopodobieństwa w modelu wielomianowym.VA VB
źródło