Czy wielomian (1 / n,…, 1 / n) można scharakteryzować jako dyskretny Dirichlet (1, .., 1)?

24

To pytanie jest nieco niechlujne, ale w celu uzupełnienia tego uwzględnię kolorowe wykresy! Najpierw tło, a następnie pytanie.

tło

Załóżmy, że masz wymiarowy rozkład wielomianowy z jednakowymi probailitami w kategoriach . Niech będzie znormalizowanymi ( ) z tego rozkładu, to znaczy:nnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

Teraz rozkład w ma obsługę -simplex, ale z dyskretnymi krokami. Na przykład przy ten rozkład ma następujące wsparcie (czerwone kropki):πnn=3

wprowadź opis zdjęcia tutaj

Innym rozkładem o podobnym wsparciu jest rozkład -dimensional , czyli równomierny rozkład w jednostce jednostronnej. Na przykład tutaj losowe losowania z 3-dimeional :Dirichlet ( 1 , , 1 ) Dirichlet ( 1 , 1 , 1 )nDirichlet(1,,1)Dirichlet(1,1,1)

wprowadź opis zdjęcia tutaj

Teraz wpadłem na pomysł, że rozkład z rozkładu można scharakteryzować jako czerpanie z które są dyskretne do dyskretnej obsługi . Dyskretyzacja, o której myślałem (i wydaje się, że działa dobrze), polega na uwzględnieniu każdego punktu w jednostce drukowanej i „zaokrągleniu” do najbliższego punktu, który jest . W przypadku trójwymiarowego simpleksu otrzymujesz następującą partycję, w której punkty w każdym kolorowym obszarze powinny „zaokrąglić” do najbliższego czerwonego punktu:Wielomianowe ( 1 / n , , 1 / n ) Dirichlet ( 1 , , 1 ) π ππMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

wprowadź opis zdjęcia tutaj

Ponieważ rozkład Dirichleta jest jednolity, wynikowa gęstość / prawdopodobieństwo dla każdego z punktów jest proporcjonalne do powierzchni / objętości, która zostaje „zaokrąglona” do każdego punktu. Dla przypadków dwuwymiarowych i trójwymiarowych prawdopodobieństwa te są następujące:

wprowadź opis zdjęcia tutaj ( te prawdopodobieństwa pochodzą z symulacji Monte Carlo )

Wydaje się więc, że przynajmniej dla 2 i 3 wymiarów wynikowy rozkład prawdopodobieństwa z dyskretyzacji w ten konkretny sposób jest taki sam jak rozkład prawdopodobieństwa dla . Jest to znormalizowany wynik dystrybucji . Próbowałem również z 4-wymiarami i wydaje się, że tam działa.π Wielomian ( 1 / n , , 1 / n )Dirichlet(1,,1)πMultinomial(1/n,,1/n)

Pytania)

Więc moje główne pytanie brzmi:

Czy dyskretyzując jednolity Dirichlet w ten konkretny sposób, czy relacja z dla dalszych wymiarów? Czy relacja w ogóle się utrzymuje? (Próbowałem tego tylko przy użyciu symulacji Monte Carlo ...)Multinomial(1/n,,1/n)

Dalej zastanawiam się:

  • Jeśli ta relacja się utrzymuje, czy jest to znany wynik? Czy jest jakieś źródło, które mogę zacytować?
  • Jeśli ta dyskretyzacja jednolitego Dirichleta nie ma tego związku z Wielomianem. Czy istnieje jakaś podobna konstrukcja?

Jakiś kontekst

Moim powodem zadania tego pytania jest to, że patrzę na podobieństwo między nieparametrycznym Bootstrapem a Bayesowskim Bootstrapem, a potem to się pojawiło. Zauważyłem również, że wzór na kolorowych obszarach na trójwymiarowym simpleksie powyżej wygląda (i powinien być) diagram Voronoi. Jednym ze sposobów (mam nadzieję), że można o tym pomyśleć, jest sekwencja trójkąta Pascala / Simpexa ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Tam, gdzie rozmiar kolorowych obszarów jest zgodny z drugim rzędem trójkąta Pascala w przypadku 2-d, trzeci rząd czworościanu Pascala w przypadku 3-d i tak dalej. To wyjaśniałoby związek z rozkładem wielomianowym, ale tutaj jestem naprawdę w głębokiej wodzie ...

Rasmus Bååth
źródło
2
zabawa! (Jak zwykle.) Ale brakuje mi połączenia skarpet.
Xi'an,
Cóż, zacząłem rysować skarpetki z zamiennikiem. Ale potem zacząłem myśleć o Bayesian Boostrap, jedna rzecz doprowadziła do drugiej i tak właśnie tu
trafiłem
2
@ Xi'an może to skarpetki, a nie szczenięta, które powinny zostać maskotką bayesowską?
Tim

Odpowiedzi:

14

Te dwie dystrybucje są różne dla każdego .n4

Notacja

Zamienię przeskalować twój simpleks o współczynnik , aby punkty sieci miały współrzędne całkowite. To nic nie zmienia, myślę, że to sprawia, że ​​notacja jest nieco mniej kłopotliwa.n

Niech będzie prostym , podanym jako wypukły kadłub punktów , ..., w . Innymi słowy, są to punkty, w których wszystkie współrzędne są nieujemne, i gdzie współrzędne sumują się do .( n - 1 ) ( n , 0 , , 0 ) ( 0 , , 0 , n ) R n nS(n1)(n,0,,0)(0,,0,n)Rnn

Niech oznacza zbiór punktów sieci , tj. Te punkty w których wszystkie współrzędne są integralne.S.ΛS

Jeśli jest punktem sieci, pozwalamy oznaczać jego komórkę Voronoi , zdefiniowaną jako te punkty w które są (ściśle) bliższe niż do dowolnego innego punktu w .V P S P ΛPVPSPΛ

Umieszczamy dwa rozkłady prawdopodobieństwa, które możemy umieścić na . Jednym z nich jest rozkład wielomianowy, w którym punkt ma prawdopodobieństwo . Drugi nazwiemy modelem Dirichleta i przypisuje on każdemu prawdopodobieństwo proporcjonalne do objętości .( 1 , . . . , N ) 2 - N N ! / ( a 1 ! a n ! ) P Λ V PΛ(a1,...,an)2nn!/(a1!an!)PΛVP

Bardzo nieformalne uzasadnienie

Twierdzę, że model wielomianowy i model Dirichleta dają różne rozkłady w , ilekroć .n 4Λn4

Aby to zobaczyć, rozważ przypadek , a punkty i . Twierdzę, że i są przystające poprzez tłumaczenie przez wektor . Oznacza to, że i mają tę samą objętość, a zatem że i mają takie samo prawdopodobieństwo w modelu Dirichleta. Z drugiej strony w modelu wielomianowym mają różne prawdopodobieństwa ( I ), I to wynika z tego, że rozkłady nie mogą być równe.A = ( 2 , 2 , 0 , 0 ) B = ( 3 , 1 , 0 , 0 ) V A V B ( 1 , - 1 , 0 , 0 ) V A V B A B 2 - 44 ! / ( 2 ! 2 ! ) 2 - 4n=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBAB244!/(2!2!)244!/3!

Fakt, że i są zgodne, wynika z następującego prawdopodobnego, ale nieoczywistego (i nieco niejasnego) twierdzenia:V BVAVB

Możliwe twierdzenie : Na kształt i rozmiar wpływ mają tylko „bezpośredni sąsiedzi” (tj. Te punkty w które różnią się od przez wektor, który wygląda jak , gdzie i mogą znajdować się w innych miejscach) P Λ P ( 1 , - 1 , 0 , , 0 ) 1 - 1VPPΛP(1,1,0,,0)11

Łatwo zauważyć, że konfiguracje „bezpośrednich sąsiadów” i są takie same, a następnie wynika, że i są przystające.B V A V BABVAVB

W przypadku, gdy , możemy grać w tę samą grę, z i , na przykład.A = ( 2 , 2 , n - 4 , 0 , , 0 ) B = ( 3 , 1 , n - 4 , 0 , , 0 )n5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

Nie sądzę, że to twierdzenie jest całkowicie oczywiste i nie zamierzam tego udowodnić, zamiast nieco innej strategii. Myślę jednak, że jest to bardziej intuicyjna odpowiedź na pytanie, dlaczego rozkłady są różne dla .n4

Rygorystyczny dowód

Weź i jak w powyższym nieformalnym uzasadnieniu. Musimy tylko udowodnić, że i są zgodne.B V A V BABVAVB

Biorąc pod uwagę , zdefiniujemy w następujący sposób: jest zbiorem punktów , dla których . (W bardziej przyswajalny sposób: Niech . jest zbiorem punktów, dla których różnica między najwyższym i najniższym jest mniejsza niż 1.)W P W P ( x 1 , , x n ) S max 1 i n ( a i - p i ) - min 1 i n ( a i - p i ) < 1 v i = aP=(p1,,pn)ΛWPWP(x1,,xn)Smax1in(aipi)min1in(aipi)<1W P v ivi=aipiWPvi

Pokażemy, że .VP=WP

Krok 1

Roszczenie: .VPWP

Jest to dość łatwe: Załóżmy, że nie ma w . Niech i załóżmy (bez utraty ogólności), że , . Ponieważ , wiemy również, że .W P v i = x i - p i v 1 = max 1 i n v i v 2 = min 1 i n v i v 1 - v 21 n i = 1 v i = 0 v 1X=(x1,,xn)WPvi=xipiv1=max1inviv2=min1inviv1v21i=1nvi=0v1>0>v2

Niech teraz . Ponieważ zarówno i mają nieujemne współrzędne, podobnie , i wynika z tego, że , a więc . Z drugiej strony, . Zatem jest co najmniej tak blisko jak , więc . To pokazuje (przyjmując uzupełnienia), że .P X Q Q S Q Λ d i s t 2 ( X , P ) - d i s t 2 ( X , Q ) = v 2 1 + v 2 2 - (Q=(p1+1,p21,p3,,pn)PXQQSQΛX Q P X V P V pW Pdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

Krok 2

Twierdzenie : są rozłączne parami.WP

Załóżmy inaczej. Niech i będą odrębnymi punktami w i niech . Ponieważ i są różne i oba w , musi istnieć jeden indeks gdzie , i jeden, gdzie . Bez utraty ogólności przyjmujemy, że i . Ponownie rozmieszczając i dodając, otrzymujemy .Q = ( q 1 , , q n ) Λ X W PW Q P Q Λ i p iq i + 1 p iq i - 1 p 1q 1 + 1 p 2q 2 -P=(p1,,pn)Q=(q1,,qn)ΛXWPWQPQΛipiqi+1piqi1p1q1+1q 1 - p 1 + p 2 - q 22p2q21q1p1+p2q22

Rozważ teraz liczby i . Z faktu, że , mamy . Podobnie oznacza, że . Łącząc je, otrzymujemy , i mamy sprzeczność.x 2 X W P x 1 - p 1 - ( x 2 - p 2 ) < 1 X W Q x 2 - q 2 - ( x 1 - q 1 ) < 1 q 1 - p 1 + p 2 - q 2 < 2x1x2XWPx1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

Krok 3

Wykazaliśmy, że i że są rozłączne. pokrywa do zestawu miary zero, i stąd, że (do zestawu środka zero). [Ponieważ zarówno i są otwarte, faktycznie mamy dokładnie , ale nie jest to konieczne.]W P V P S W P = V P W P V P W P = V PVPWPWPVPSWP=VPWPVPWP=VP

Teraz już prawie skończyliśmy. Rozważ punkty i . Łatwo zauważyć, że i są przystające i tłumaczą się nawzajem: jedynym sposobem, w jaki mogą się różnić, jest to, że granica (inna niż twarze, na których leżą obie i ) `` odcina się '' albo lub ale nie drugiej. Ale aby osiągnąć taką część granicy , musielibyśmy zmienić jedną współrzędną lub o co najmniej 1, co wystarczyłoby, aby zagwarantować nam wyprowadzenie zA=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAi tak. Tak więc, chociaż wygląda inaczej niż punkty obserwacyjne i , różnice są zbyt daleko, aby można je było w definicjach i , a zatem i są przystające.WBSABWAWBWAWB

Wynika z tego, że i mają tę samą objętość, a zatem model Dirichleta przypisuje im takie samo prawdopodobieństwo, mimo że mają różne prawdopodobieństwa w modelu wielomianowym.VAVB

ZH Liu
źródło
Wow, rygorystyczny! Dzięki! Tak więc niewielka korespondencja, na którą
liczyłem,