Jak nazywałem się ten rozkład dyskretny (równanie różnicy rekurencyjnej)?

11

Natknąłem się na tę dystrybucję w grze komputerowej i chciałem dowiedzieć się więcej o jej zachowaniu. To zależy od decyzji, czy określone zdarzenie powinno nastąpić po określonej liczbie akcji gracza. Szczegóły poza tym nie są istotne. Wydaje się, że ma zastosowanie w innych sytuacjach, i uważam to za interesujące, ponieważ jest łatwe do obliczenia i tworzy długi ogon.

Na każdym kroku gra generuje jednolitą liczbę losową . Jeśli , zdarzenie jest wyzwalane. Po wystąpieniu zdarzenia gra resetuje i ponownie przechodzi przez sekwencję. Interesuje mnie tylko jedno wystąpienie zdarzenia dotyczącego tego problemu, ponieważ reprezentuje ono dystrybucję używaną przez grę. (Na wszelkie pytania dotyczące wielu wystąpień można odpowiedzieć za pomocą jednego modelu wystąpienia).nX < p ( n ) n = 00X<1X<p(n)n=0

Główną „nienormalnością” jest tutaj to, że parametr prawdopodobieństwa w tym rozkładzie zwiększa się z czasem lub, innymi słowy, próg rośnie z czasem. W tym przykładzie zmienia się liniowo, ale przypuszczam, że mogą obowiązywać inne reguły. Po krokach lub czynnościach użytkownikan

p(n)=kn

dla niektórych stałych . W pewnym momencie otrzymujemy p (n _ {\ max}) \ geq 1 . Zdarzenie jest po prostu gwarantowane na tym etapie.0<k<1nmaxp(nmax)1

Byłem w stanie to ustalić

f(n)=p(n)[1F(n1)]
i dla PMF i CDF . W skrócie, prawdopodobieństwo, że zdarzenie zajmie ty stopień, jest równe prawdopodobieństwu , pomniejszonemu o prawdopodobieństwo, że zdarzyło się to już na którymkolwiek poprzednim etapie.
F(n)=p(n)+F(n1)[1p(n)]
f(n)F(n)np(n)

Oto fabuła naszego przyjaciela Monte Carlo, dla zabawy, z . Mediana osiąga wartość 21, a średnia wynosi 22. k0.003wprowadź opis zdjęcia tutaj

Jest to zasadniczo równoznaczne z równaniem różnicy pierwszego rzędu z cyfrowego przetwarzania sygnału, które jest moim tłem, więc odkryłem, że jest to całkiem nowe. Intryguje mnie również to, że może się różnić zgodnie z dowolną dowolną formułą.p(n)

Moje pytania:

  1. Jak nazywa się ta dystrybucja, jeśli ją posiada?
  2. Czy istnieje sposób uzyskania wyrażenia dla bez odniesienia do ?F ( n )f(n)F(n)
  3. Czy istnieją inne przykłady takich dyskretnych rozkładów rekurencyjnych?

Edycje Wyjaśniono proces dotyczący generowania liczb losowych.

jbarlow
źródło
1
Czy jest jakiś powód, dla którego wybrałeś nawiasy kwadratowe zamiast ()?
Cam.Davidson.Pilon
1
@ Cam.Davidson.Pilon: Moje tło DSP wślizgnęło się. Zazwyczaj używamy nawiasów kwadratowych do dyskretnych funkcji czasowych. Myślę, że to musi być denerwujące, więc to zmienię.
jbarlow
1
Proces, który zakładasz, nie wydaje się tutaj jasno zdefiniowany. Mówisz „Na każdym kroku gra rzuca losową liczbą Jeśli , to zdarzenie jest wyzwalane”. Ale nie podajesz specyfikacji, jak rysowaćMyślę, że byłoby pomocne, gdyby proces ten można było opisać nieco dokładniej. X X < p ( n ) XnXX<p(n)X
kardynał
2
@jbarlow: Przepraszam, jeśli moja poprzednia uwaga była niejasna. Jeśli dla niektórych , to nie ma możliwości, aby twój proces mógł mieć więcej niż kroków, ponieważ jednolita losowa liczba od zera do jednego byłaby zdecydowanie mniejsza niż dla dowolnego . Wielkość jako funkcja jest bardzo ściśle związana z tak zwaną funkcją hazardu w podpolu statystyki znanej jako analiza przeżycia . 0 < k < 1 k - 1p ( n ) n > 1 / k p ( n ) np(n)=kn0<k<1k1p(n)n>1/kp(n)n
kardynał
1
Dla małego użycie analogu różnicowego tego równania różnicowego pokazuje, że ( nie !) Jest zbliżone do Gaussa. (Z tego natychmiast wywnioskowujemy na przykład, że średnia musi być w pobliżu ). Należy również pamiętać, że istnieją pewne (silne) ograniczenia dla , w przeciwnym razie, gdy przekroczy (co ostatecznie to robi), nie ma gwarancji, że pozostaje mniejsze lub równe . F f kF fkp(n)11/k=33318kp(n)1F1
whuber

Odpowiedzi:

9

W pewnym sensie to, co zrobiłeś, to scharakteryzowanie wszystkich nieujemnych rozkładów o wartościach całkowitych.

Odłóżmy na chwilę opis losowego procesu i skupmy się na rekurencjach w pytaniu.

Jeśli , to z pewnością . Jeśli przepiszemy drugą rekurencję pod względem funkcji przeżycia (gdzie ma rozkład ), otrzymamy coś bardzo sugestywnego i łatwego w obsłudze. Oczywiście a więc Tak więc, o ile nasza sekwencja przyjmuje wartości w i nie zbiega się zbyt szybko do zera, to otrzymamy prawidłową funkcję przeżycia (tj. Monotonicznie zmniejszającą się do zera jako ).F n = p n + ( 1 - p n ) F n - 1 S n = 1 - F n = P ( T > n ) T F S n = 1 - F n = ( 1 - p n ) S nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 0 ( 1 - p k )

Sn=1Fn=(1pn)Sn1,
( p n ) [ 0 , 1 ] n
Sn=k=0n(1pk).
(pn)[0,1]n

Dokładniej,

Twierdzenie : Sekwencja przyjmująca wartości w określa rozkład na nieujemnych liczbach całkowitych wtedy i tylko wtedy, gdy i wszystkie takie rozkłady mają odpowiednią sekwencję (chociaż może nie być unikalna).[ 0 , 1 ] - n = 0 log ( 1 - p n ) = (pn)[0,1]

n=0log(1pn)=,

Zatem rekurencja zapisana w pytaniu jest w pełni ogólna : każdy nieujemny rozkład wartości całkowitych ma odpowiednią sekwencję przyjmującą wartości wynoszącą .[ 0 , 1 ](pn)[0,1]

Jednak odwrotność nie jest prawdą; to znaczy istnieją sekwencje o wartościach w , które nie odpowiadają żadnemu prawidłowemu rozkładowi. (W szczególności rozważ dla wszystkich a dla )[ 0 , 1 ] 0 < p n < 1 n N p n = 0 n > N(pn)[0,1]0<pn<1nNpn=0n>N

Ale czekaj, jest więcej!

Wskazaliśmy na związek z analizą przeżycia i warto to zbadać nieco głębiej. W klasycznej analizie przeżycia z absolutnie ciągłym rozkładem i odpowiednią gęstością , funkcja hazardu jest zdefiniowana jako f h ( t ) = f ( t )Ff

h(t)=f(t)S(t).

Łączny zagrożenia następnie i prostą analizę pochodnych pokazuje, że Na tej podstawie możemy natychmiast podać charakterystykę dopuszczalnej funkcji hazardu: jest to dowolna mierzalna funkcja taka, że dla wszystkich i jako .Λ(t)=0th(s)ds

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0t0th(s)dst

Otrzymujemy podobną rekurencję dla funkcji przeżycia do powyższej, zauważając, że dlat>t0

S(t)=et0th(s)dsS(t0).

Zauważ w szczególności , że moglibyśmy wybrać aby była stała kawałek po kawałku, każdy kawałek ma szerokość 1 i taki, że całka zbiega się w nieskończoność. Dałoby to funkcję przeżycia która pasuje do dowolnej pożądanej nieujemnej liczby całkowitej o wartości jednej przy każdej liczbie całkowitej dodatniej.h(t)S(t)

Ponowne połączenie z dyskretną obudową

Aby dopasować pożądaną dyskretną na każdej liczbie całkowitej, powinniśmy wybrać funkcję hazardu, która jest częściowo stała, tak że on . To drugi dowód warunku koniecznego dla sekwencji aby zdefiniować prawidłowy rozkład.S(n)

h(t)=hn=log(1pn),
(n1,n](pn)

Zauważ, że dla małych , który zapewnia heurystyczne połączenie między funkcją hazardu rozkładu ciągłego a rozkładem dyskretnym z dopasowaniem funkcji przeżycia na liczby całkowite.pnlog(1pn)pn=fn/Sn1

Postscriptum : Jako ostatnia uwaga, przykład w pytaniu nie spełnia niezbędnych warunków bez odpowiedniej modyfikacji przy i ustawieniu dla wszystkich .pn=knfnn=k1fn=0n>k1

kardynał
źródło
1
+1 Bardzo rozświetlające. Jednak w odniesieniu do postscriptum wydaje mi się, że „odpowiednie obcięcie” występuje oczywiście dla specjalnych wartości . Na przykład, przy otrzymujemy , a bardziej ogólnie, przy otrzymujemy . kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber
2
@whuber: Powinienem był jaśniej sprecyzować, co rozumiem przez „odpowiednie obcięcie”. Myślałem o obcięciu (zmniejszeniu) wartości w określonym punkcie (aby stał się jednością). Myślę, że pojęcie to jest nadal aktualne w przypadku, o którym wspominasz, po prostu, że obcięcie nie spowoduje zmiany wartości . Spróbuję to wyjaśnić wkrótce w edycji. Dziękuję Ci! fnFnfn
kardynał
2
Świetna odpowiedź. To jest bardzo wnikliwe. Byłem bardzo zainteresowany tym problemem związanym z innymi obszarami i koncepcjami.
jbarlow,
1
@jbarlow: Dziękuję. Cieszę się, że okaże się przydatny! Podobało mi się trochę o tym myśleć, bo to miłe pytanie.
kardynał
9

W przypadku, gdy , mamy pewne znane właściwości. Możemy rozwiązać relację powtarzalnościp(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

ma rozwiązanie

F(n)=P(Nn)=1(1p)n+1
który jest rozkładem geometrycznym . Jest dobrze zbadany.

Bardziej ogólny przypadek prawdopodobnie nie może być obliczony w formie zamkniętej, a zatem prawdopodobnie nie ma znanego rozkładu.p(n)

Inne przypadki:

  1. p(n)=pn;p<1;F(0)=p ma rozwiązanie co nie jest powszechnie znaną dystrybucją.
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. Zdefiniuj (znany jako funkcja przeżycia w statystykach), powyższa relacja powtarzalności sprowadza się do prostszej postaci: S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. Z twojego przykładu wynika, że ​​potrzebujesz funkcji która zwiększa się w . Twój wybór nie jest świetny analitycznie z powodu przerwy przy . Matematycy i statystyki wolą gładkie rzeczy. Proponuję więc które i zbiega się do 1. Rozwiązanie relacji rekurencyjnej z tym ma ładną formę analityczną: Zastanów się . Znanym faktem statystycznym jest to, że p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)S(n)=1-F(n)=(1-p) n + 1
    F(n)=1(1p)n+1n!
    i=0S(i)=E[N]E[N]=(1-p)e(1-p)S(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    który, jeśli pamiętacie jakiś rachunek różniczkowy, wygląda bardzo podobnie do wykładniczej serii Taylora, stąd
    E[N]=(1p)e(1p)
Cam.Davidson.Pilon
źródło