Zastanawiam się, czy istnieją jakieś standardowe rozkłady na podzbiorach liczb całkowitych . Równolegle możemy to wyrazić jako rozkład na wektor długości wyników binarnych, np. Jeśli to odpowiada wektorowi .
Idealnie szukam jakiejś dystrybucji , pochodzącej z rodziny indeksowanej skończonym parametrem wymiarowym , która rozdzieliłaby swoją masę w taki sposób, że dwa wektory binarne i będą miały podobne prawdopodobieństwo, jeśli są „blisko” razem, tzn. i mają podobne prawdopodobieństwa. Mam nadzieję, że to, co zamierzam zrobić, polega na tym, żeby tak, że jeśli wiem, że jest dość duży, to jest prawdopodobnie duży w stosunku do wektorów daleko od .
Jedną ze strategii, która przychodzi na myśl, byłoby umieszczenie metryki lub innej miary rozproszenia na na a następnie wzięcie lub coś podobnego. Wyraźnym przykładem byłoby analogicznie do rozkładu normalnego. W porządku, ale mam nadzieję, że istnieje coś standardowego i podlegającego analizie bayesowskiej; dzięki temu nie mogę zapisać stałej normalizującej.
źródło
Odpowiedzi:
Możesz preferować rodziny lokalizacji oparte na odległości Hamminga , ze względu na ich bogactwo, elastyczność i podatność na obliczenia.
Notacja i definicje
Przypomnijmy, że w wolnej modułu skończonej trójwymiarowy Bazując The odległość Hamminga pomiędzy dwoma wektorami i jest liczba miejsc gdzie .V (e1,e2,…,eJ) δH v=v1e1+⋯+vJeJ w=w1e1+⋯+wJeJ i vi≠wi
Biorąc pod uwagę dowolne pochodzenie , odległość Hamminga dzieli na sfery , , gdzie . Kiedy pierścień uziemiający ma elementów, ma elementów, a ma . (Wynika to natychmiast z obserwacji, że elementy różnią się od w dokładnie miejscach - w których jestv0∈V V Si(v0) i=0,1,…,J Si(v0)={w∈V | δH(w,v0)=i} n V nJ Si(v) (Ji)(n−1)i Si(v) v i (Ji) możliwości - i że istnieje niezależnie wybór wartości dla każdego miejsca).n−1
Tłumaczenie afiniczne w działa naturalnie na jego dystrybucje, dając rodziny lokalizacji. W szczególności, gdy jest dowolnym rozkładem na (co oznacza niewiele więcej niż , dla wszystkich , i ) i jest dowolnym elementem , to jest również rozkładem gdzieV f V f:V→[0,1] f(v)≥0 v∈V ∑v∈Vf(v)=1 w V f(w)
wszystkie . Rodzinę Położenie rozkładów niezmienna przy tym działania: oznacza dla wszystkich .v∈V Ω f∈Ω f(v)∈Ω v∈V
Budowa
To pozwala nam zdefiniować potencjalnie interesujące i przydatne rodziny rozkładów, określając ich kształty w jednym stałym wektorze , co dla wygody wezmę za i tłumaczenie tych „rozkładów generowania” pod działaniem celu uzyskania pełnej rodziny . Aby osiągnąć pożądaną właściwość, która powinna mieć porównywalne wartości w pobliskich punktach, po prostu wymagaj tej właściwości wszystkich rozkładów generowania.v 0=(0,0,…,0) V Ω f
Aby zobaczyć, jak to działa, stwórzmy rodzinę lokalizacji wszystkich rozkładów, które zmniejszają się wraz ze wzrostem odległości. Ponieważ możliwe są tylko odległości Hamminga , rozważ każdą malejącą sekwencję nieujemnych liczb rzeczywistych = . ZestawJ+1 a 0≠a0≥a1≥⋯≥aJ≥0
i zdefiniuj funkcję przezfa:V→[0,1]
Potem, jak to łatwe do sprawdzenia, jest dystrybucja na . Ponadto wtedy i tylko wtedy, gdy jest dodatnią wielokrotnością (jako wektory w ). Zatem, jeśli chcemy, możemy standaryzować do .fa V fa=fa′ a′ a RJ+1 a a0=1
Odpowiednio, ta konstrukcja daje wyraźną parametryzację wszystkich takich niezmiennych lokalizacji, które maleją wraz z odległością Hamminga: każdy taki rozkład ma postać dla pewnej sekwencji niektóre wektor .f(v)a a=1≥a1≥a2≥⋯≥aJ≥0 v∈V
Ta parametryzacja może pozwolić na wygodną specyfikację priorów: uwzględnij je w przedziale w lokalizacji i przed w kształcie . (Oczywiście można rozważyć większy zestaw priorytetów, w których lokalizacja i kształt nie są niezależne, ale byłoby to bardziej skomplikowane przedsięwzięcie).v a
Generowanie losowych wartości
Jednym ze sposobów na pobranie próbki z jest etapowanie poprzez podzielenie jej na rozkład w promieniu kulistym i inny rozkład zależny od każdej kuli:f(v)a
Narysuj indeks z rozkładu dyskretnego na podany przez prawdopodobieństwa , gdzie jest zdefiniowane jak poprzednio .i {0,1,…,J} (Ji)(n−1)iai/A A
Indeks odpowiada zestawowi wektorów różniących się od w dokładnie miejscach. Dlatego wybierz te miejsca spośród możliwych podzbiorów , dając każdemu jednakowemu prawdopodobieństwu. (To jest tylko przykładowy indeksy z bez zastąpienia). Niech to podzbiór miejscach być napisany .i v i i (Ji) i J i I
Narysuj element , niezależnie wybierając wartość równomiernie ze zbioru skalarów od dla wszystkich a w przeciwnym razie ustaw . utwórz wektor , wybierając losowo z niezerowych skalarów, gdy a w przeciwnym razie ustawiając . Ustaw .w wj vj j∈I wj=vj u uj j∈I uj=0 w=v+u
Krok 3 jest niepotrzebny w przypadku binarnym.
Przykład
Oto
R
implementacja do zilustrowania.Jako przykład jego zastosowania:
Miało to sekundy zwrócić lid elementy Distribution , gdzie , (w przypadku binarnej), i maleje wykładniczo.0.2 104 f(v)a J=10 n=2 v=(1,1,…,1) a=(211,210,…,21)
(Ten algorytm nie wymaga zmniejszania ; w ten sposób będzie generować losowe zmienne z dowolnej rodziny lokalizacji, nie tylko z tych jednomodalnych.)a
źródło
Próbka z procesu punktowego determinującego k modeluje rozkład na podzbiory, który zachęca do różnorodności, tak że podobne elementy rzadziej występują razem w próbce. Zapoznaj się z próbkowaniem w procesie punktowym wyznaczania K przez Alexa Kuleszy, Ben Taskar.
źródło