Konstruowanie dyskretnego rv mającego jako wsparcie wszystkie racjonalne argumenty w

19

To jest konstruktywistyczna kontynuacja tego pytania .

Jeśli nie możemy mieć dyskretnej jednorodnej zmiennej losowej mającej wszystkie racjonalności w przedziale [0,1] , to następną najlepszą rzeczą jest:

Skonstruuj losową zmienną Q która ma to wsparcie, QQ[0,1] i która ma pewien rozkład. I rzemieślnik we mnie wymaga, aby ta zmienna losowa była konstruowana z istniejących rozkładów, a nie tworzona przez abstrakcyjne zdefiniowanie tego, co chcemy uzyskać.

Więc wpadłem na następujące:

Niech X będzie dyskretną zmienną losową zgodną z rozkładem geometrycznym-wariant II z parametrem 0<p<1 , mianowicie

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

Niech również Y będzie dyskretną zmienną losową podążającą za rozkładem geometrycznym-wariantem I o identycznym parametrze p , mianowicie

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

X iY są niezależne. Zdefiniuj teraz zmienną losową

Q=XY

i rozważ rozkład warunkowy

P(Qq{XY})

W luźnych słowach „warunkowy jest stosunkiem X do Y pod warunkiem, że X jest mniejszy lub równy od Y ”. Podpora tego rozkładu warunkowym { 0 , 1 , 1 / 2 , 1 / 3 , . . . , 1 / K , 1 / ( K + 1 ) , . . . , 2 / 3 , 2 / 4QXYXY .{0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1]

„Pytanie” brzmi: czy ktoś może podać powiązaną funkcję masy prawdopodobieństwa warunkowego?

W komentarzu zapytano „czy powinien być zamknięty”? Ponieważ to, co obecnie stanowi formę zamkniętą, nie jest tak jednoznaczne, powiem to tak: szukamy formy funkcjonalnej, w której możemy wprowadzić liczbę wymierną z i uzyskać prawdopodobieństwo (dla niektórych określona wartość parametru p ), co prowadzi do orientacyjnego wykresu pmf. A następnie zmieniaj p, aby zobaczyć, jak zmienia się wykres.[0,1]pp

Jeśli to pomoże, możemy otworzyć jedną lub obie granice wsparcia, chociaż te warianty pozbawią nas możliwości wyraźnego wykresu górnych i / lub dolnych wartości pmf . Ponadto, jeśli otworzymy górną granicę, powinniśmy rozważyć zdarzenie warunkowania .{X<Y}

Alternatywnie, witam również innych RV, którzy mają to wsparcie (wsparcie), pod warunkiem, że przychodzą razem z pmf .

Użyłem rozkładu geometrycznego, ponieważ ma on łatwo dostępne dwa warianty, przy czym ten nie zawiera zeru we wsporniku (dzięki czemu unika się dzielenia przez zero). Oczywiście można użyć innych dyskretnych wartości RV, stosując pewne obcinanie.

Z pewnością wynagrodzę to pytanie, ale system nie pozwala na to od razu.

Alecos Papadopoulos
źródło
1
Czy masz na myśli ? (warunkowe zdefiniowanie zmiennej losowej na czymś nie ma sensu, można tak zdefiniować tylko jej rozkład)Q=XY1{XY}
Stéphane Laurent,
1
Twoje Q jest policzalne: wiesz, że istnieje korespondencja 1-1 między N = {1, 2, ...} i Q. Jeśli możesz znaleźć taką korespondencję, rozwiązaniem byłoby wybranie dowolnego rozkładu na N i użycie go wybrać odpowiedni element Q.
Adrian
w każdym razie musisz obliczyć dla każdej nieredukowalnej frakcji p / q i jest to Pr ( X = p , X = 2 p , ) × Pr ( Y = q , Y = 2 q , ) . Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
Stéphane Laurent,
1
Czy wymóg podania pmf oznacza, że ​​wymagany jest formularz zamknięty? A może np. Nieskończona suma @ StéphaneLaurent wystarczy, aby spełnić warunek?
Juho Kokkala,
1
Niech i Y RV na twoim stanowisku. P r [ Q = q ] = P r [ Y = f - 1 ( q ) ]f:NQ[0,1]Pr[Q=q]=Pr[Y=f1(q)]
Adrian

Odpowiedzi:

19

Rozważ dyskretny rozkład z obsługą zestawu { ( p , q )F z masami prawdopodobieństwa{(p,q)|qp1}N2

F(p,q)=321+p+q.

Można to łatwo zsumować (wszystkie zaangażowane serie są geometryczne), aby wykazać, że tak naprawdę jest rozkładem (całkowite prawdopodobieństwo to jedność).

Dla dowolnej niezerowej liczby wymiernej niech a / b = x będzie jej reprezentacją w najniższych kategoriach: to znaczy b > 0 i gcd ( a , b ) = 1 .xa/b=xb>0gcd(a,b)=1

indukuje rozkład dyskretny G na [ 0 , 1 ] Q za pomocą regułFG[0,1]Q

G(x)=G(ab)=n=1F(an,bn)=321+a+b2.

(i ). Każda liczba wymierna w ( 0 , 1 ) ma niezerowe prawdopodobieństwo. (Jeśli musisz uwzględnić 0 wśród wartości z prawdopodobieństwem dodatnim, po prostu odejmij część prawdopodobieństwa od innej liczby - na przykład 1 - i przypisz ją do 0. )G(0)=0(0,1]010

Aby zrozumieć tę konstrukcję, spójrz na to przedstawienie :F

[Rysunek F]

daje masy prawdopodobieństwa we wszystkich punktach p , q z dodatnimi współrzędnymi całkowitymi. Wartości F są reprezentowane przez kolorowe obszary okrągłych symboli. Linie mają nachylenia p / q dla wszystkich możliwych kombinacji współrzędnych p i q pojawiających się na wykresie. Są kolorowe w taki sam sposób, jak okrągłe symbole: zgodnie z ich nachyleniem. Tak więc, nachylenie (co wyraźnie mieści się w zakresie od 0 przez 1 ) i barwy odpowiadaargumentuz G i wartości GFp,qFp/qpq01GGsą uzyskiwane przez zsumowanie obszarów wszystkich kół leżących na każdej linii. Na przykład uzyskuje się przez zsumowanie obszarów wszystkich (czerwonych) kół wzdłuż głównej przekątnej nachylenia 1 , podanych przez F ( 1 , 1 ) + F ( 2 , 2 ) + F ( 3 , 3 ) + = 3 / 8 + 3 / 32 + 3 / 128 + = 1 /G(1)1F(1,1)+F(2,2)+F(3,3)+ .3/8+3/32+3/128+=1/2

Postać

Ta Figura przedstawia przybliżenie przez ograniczenie q 100 : to działki swoje wartości w 3044 liczb wymiernych od 1 / 100 przez 1 . Największe masy prawdopodobieństwa to 1Gq10030441/1001.12,314,110,362,362,142,

Oto pełny CDF z (dokładny do rozdzielczości obrazu). Sześć wymienionych powyżej liczb podaje rozmiary widocznych skoków, ale każda część CDF składa się ze skoków, bez wyjątku:G

Rysunek 2

Whuber
źródło
1
Dzięki! Jestem w trakcie rozumienia konstrukcji. Tylko dwa pytania: a) jest dwuwymiarowy, ale w wyrażeniu łączącym go z G pojawia się jako jednowymiarowy. Czy coś brakuje? oraz b) Ponieważ G jest jednoznaczny, wydaje mi się, że wszystkie kropki na efektownie wyglądającym pierwszym wykresie reprezentują inną wartość na osi poziomej (chociaż oczywiście nie można tego dokładnie przedstawić w takiej skali), prawda? FGG
Alecos Papadopoulos,
Właśnie uzupełniałem rysunek, który może dotyczyć twojego komentarza, Alecos, i dodałem go do odpowiedzi. Zauważ, że mógłbym zacząć od dowolnego dyskretnego rozkładu i zbudować G w ten sam sposób; ten konkretny rozkład został wybrany, aby ułatwić obliczenia. FG
whuber
Staje się coraz lepszy, jeśli chodzi o moje pierwsze pytanie w poprzednim komentarzu, czy powinno to być zamiastF(aF(ab,n)? To znaczy, żep=a/biq=n? F(abn)p=a/bq=n
Alecos Papadopoulos,
To lepsza odpowiedź niż moja! Zauważyłem dwie małe rzeczy: Myślę, że twoje F (p, q) sumuje się do 4, jak napisano. Również w poniższym równaniu „F indukuje dyskretny rozkład G” powinieneś mieć F (na, nb) nie?
Adrian
@Adrian, Alecos Dzięki za złapanie tych literówek: powinno być a - 1, a oznaczenie F oczywiście jest niepoprawne. Naprawię je od razu. 11F
whuber
8

Złożyłbym swoje komentarze i opublikuję je jako odpowiedź tylko dla jasności. Oczekuję jednak, że nie będziesz bardzo zadowolony, ponieważ wszystko, co robię, to redukuję problem do innego.

Moja notacja:

jest RV, którego wsparcie wynosi Q[ 0 , 1 ] - moje Q niejesttakie samo jak Q konstruowane przez OP z jego XQQ[0,1]QQ . Zdefiniujemy toQza pomocąYif, które przedstawiam poniżej.XYQYf

oznacza każdy samochód kempingowy, którego wsparcie wynosi N{ 1 , 2 , } - Y podane przez PO działałoby na przykład.YN{1,2,}Y

oznacza dowolną korespondencję jeden do jednego f : NQ[ 0 , 1 ], a f - 1 jest jej odwrotnością. Wiemy, że one istnieją.ff:NQ[0,1]f1

Teraz twierdzę, że mogę zredukować twój problem do znalezienia i jego f - 1 :ff1

Po prostu pozwól i gotowe. PMF dla Q wynosi Pr [ Q = q ] = Pr [ Y = f - 1 ( q ) ] .Q=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

Edytować:

Oto funkcja g, która odgrywa rolę , mimo że nie jest korespondencją jeden do jednego (z powodu duplikatów):f

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}
Adrian
źródło
N{1,2,}ff1
Alecos Papadopoulos
f1
W podanym linku jest napisane w pewnym momencie: „Zauważ, że nie jest konieczne znalezienie wzoru na korespondencję; wszystko, co jest konieczne, to pewność, że taka korespondencja istnieje. Istnieje wiele innych przypadków matematyki, które są takie - gdzie chodzi o to, aby pokazać, że coś musi się wydarzyć lub że coś istnieje, zamiast faktycznie wykazywać formułę ”. Cóż, w moim pytaniu chodzi o formułę : z jakiegoś powodu nazwałem to pytanie „konstruktywistą”.
Alecos Papadopoulos
1
Myślę, że mogę podać algorytm, który by działał - pomyślę o tym trochę więcej.
Adrian
Wysłałem coś - pozwala symulować Q, ale nie rozwiązuje problemu PMF.
Adrian