Rozkłady na posortowane listy

10

Powiedzmy, że mamy uporządkowaną listę przedmiotów

[a, b, c, ... x, y, z, ...]

Szukam rodziny dystrybucji z obsługą na powyższej liście, regulowanej przez niektóre parametry alfa, dzięki czemu:

  • Dla alfa = 0 przypisuje prawdopodobieństwo 1 do pierwszego elementu, a powyżej, i 0 do reszty. Oznacza to, że jeśli próbkujemy z tej listy, z wymianą, zawsze otrzymujemy a.
  • Wraz ze wzrostem alfa przypisujemy coraz większe prawdopodobieństwa reszcie listy, przestrzegając kolejności listy, po ~ wykładniczym rozkładzie.
  • Gdy alfa = 1, przypisujemy jednakowe prawdopodobieństwo wszystkim pozycjom na liście, więc próbkowanie z listy przypomina ignorowanie jej kolejności.

Jest to bardzo podobne do rozkładu geometrycznego, ale istnieją pewne znaczące różnice:

  • Rozkład rozkładu geometrycznego jest zdefiniowany dla wszystkich liczb naturalnych. W moim przypadku powyżej lista ma ustalony rozmiar.
  • Rozkład geometryczny nie jest zdefiniowany dla alfa = 0.
Amelio Vazquez-Reina
źródło
1
Wygląda na to, że opisujesz rodzinę skróconych rozkładów geometrycznych. Istnieje jednak nieskończenie wiele rodzin, które zachowują się jakościowo jak opis. Chodzi o to, aby wyjaśnić, do czego chciałbyś wykorzystać taką rodzinę.
whuber
Dzięki @whuber Tak, rozumiem, że istnieje nieskończenie wiele dystrybucji pasujących do tego opisu. Jakieś konkretne, które przychodzą ci na myśl? Mam system, który aktualnie wybiera pierwszy element tej listy (reprezentujący wyniki), ale chcę losowo wybrać ten wybór (i sparametryzować tę randomizację). Nie szukam konkretnego rodzaju „rozpadu” opartego na alfa. Tak długo, jak alfa = 0 nie reprezentuje losowości, tj. Wybierz pierwszy element, 1 oznacza „wybierz dowolny element”, a cyfry od 0 do 1 oznaczają „coś pomiędzy” tymi dwoma alfami, byłoby wystarczająco dobre.
Amelio Vazquez-Reina

Odpowiedzi:

11

rii{0,1,,n1}ni

pi=αrik=1nαrk

α=000=1α<11αn1αα=1n

α=1α0

α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

α

wprowadź opis zdjęcia tutaj

josliber
źródło
Miły. Jest to o wiele mądrzejsze, niż mogłem się spodziewać.
Matthew Drury
@Matthew Są to skrócone rozkłady geometryczne, o których wspominałem wcześniej.
whuber
4

Spróbuję zbudować przykład z pierwszych zasad.

Weźmy trzy dystrybucje jako nasze bloki konstrukcyjne:

  • P jest rozkładem przypisującym prawdopodobieństwo do pierwszego elementu listy, od zera do wszystkich pozostałych.
  • 12141
  • U jest równomiernym rozkładem na liście.

Teraz chcemy wziąć jednoparametrową rodzinę dodatnich wypukłych kombinacji tych rozkładów

α(t)P+β(t)E+γ(t)U

α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

Oto opcja krzywej:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

(1t,0,t)(13,13,13)t(0,1)

Matthew Drury
źródło