Losowy spacer z pędem

18

Rozważ losową liczbę całkowitą rozpoczynającą się od 0 z następującymi warunkami:

  • Pierwszy krok to plus lub minus 1, z jednakowym prawdopodobieństwem.

  • Każdy przyszły krok to: 60% prawdopodobnie będzie w tym samym kierunku co poprzedni krok, 40% prawdopodobnie będzie w przeciwnym kierunku

Jaki rodzaj dystrybucji to daje?

Wiem, że losowy spacer bez pędu daje rozkład normalny. Czy pęd po prostu zmienia wariancję, czy całkowicie zmienia charakter rozkładu?

Szukam ogólnej odpowiedzi, więc o 60% i 40% powyżej, naprawdę mam na myśli p i 1-p

bariera
źródło
Właściwie @Dilip, trzeba łańcuch Markowa o stanach zaindeksowane przez uporządkowanych par (i,i+1) i (i,i1) , iZ . Przejścia to (i,i+1)(i+1,i+1) oraz (i,i1)(i1,i) z prawdopodobieństwemp oraz(i,i+1)(i+1,i) oraz(i,i1)(i1,i2) z prawdopodobieństwem1p .
whuber
Zauważ, że rozmiary stopni tworzą łańcuch Markowa na {1,+1} i zdarza się (?!), że zacząłeś to od dystrybucji stacjonarnej.
kardynał
Czy chcesz ograniczyć (marginalny) rozkład dla Sn=i=1nXn gdzie Xn{1,+1} to kroki marszu?
kardynał
Innym podejściem może być spojrzenie na przemienne sumy geometrycznych zmiennych losowych, a następnie zastosowanie teorii martingale. Problem polega na tym, że musisz zdefiniować jakiś czas zatrzymania, co może być trudne.
shabbychef

Odpowiedzi:

8

Aby od razu dojść do konkluzji, „pęd” nie zmienia faktu, że rozkład normalny jest asymptotycznym przybliżeniem rozkładu losowego marszu, ale wariancja zmienia się z na n p / ( 1 - p ) . Można to wywnioskować ze względnie elementarnych rozważań w tym szczególnym przypadku. Powiedzmy, że uogólnienie poniższych argumentów do CLT dla łańcuchów Markowa o skończonej przestrzeni stanów nie jest trudne, ale największym problemem jest w rzeczywistości obliczenie wariancji. W przypadku konkretnego problemu może to zrobić4np(1p)np/(1p)być obliczonym, i mam nadzieję, że poniższe argumenty mogą przekonać czytelnika, że ​​jest to poprawna wariancja.

Korzystając z wglądu przedstawionego przez kardynała w komentarzu, losowy spacer podaje się jako gdzie X k{ - 1 , 1 }, a X k tworzą łańcuch Markowa z macierzą prawdopodobieństwa przejścia ( p 1 - p 1 - p p ) . Dla rozważań asymptotycznych, gdy n początkowy rozkład X 1 nie odgrywa żadnej roli, więc naprawmy

Sn=k=1nXk
Xk{1,1}Xk
(p1p1pp).
nX1 ze względu na następujący argument i przyjmijmy również, że 0 < p < 1 . Zręczną techniką jest rozkład łańcucha Markowa na niezależne cykle. Niech σ 1 oznacza po raz pierwszy, po czasie 1, że łańcuch Markowa powraca do 1. To znaczy, jeśli X 2 = 1, to σ 1 = 2 , a jeśli X 2 = X 3 = - 1 i X 4 = 1, to σ 1 = 4X1=10<p<1σ1X2=1σ1=2X2=X3=1X4=1σ1=4. Ogólnie rzecz biorąc, niech oznacza i -ty czas powrotu do 1, a niech τ i = σ i - σ i - 1 oznaczają czasy powrotu (z σ 0 = 1 ). Dzięki tym definicjom mamyσiiτi=σiσi1σ0=1
  • Przy a następnie S σ n = X 1 + n i = 1 U i .Ui=k=σi1+1σiXk
    Sσn=X1+i=1nUi.
  • Ponieważ przyjmuje wartość - 1 dla k = σ i - 1 + 1 , , σ i - 1 i X σ i = 1, przyjmuje, że U i = 2 - τ i .Xk1k=σi1+1,,σi1Xσi=1
    Ui=2τi.
  • Czasy między zwrotami , , dla łańcucha Markowa wynoszą iid (formalnie z powodu silnej właściwości Markowa), aw tym przypadku ze średnią E ( τ i ) = 2 i wariancją V ( τ i ) = 2 pτiE(τi)=2 . Poniżej pokazano, jak obliczyć średnią i wariancję.V(τi)=2p1p
  • Zwykły CLT dla zmiennych iid daje
    SσnasympN(0,2np1p).
  • Ostatnią rzeczą do odnotowania, która wymaga niewielkiego skoku wiary, ponieważ pomijam szczegóły, jest to, że , co daje S n asymp N ( 0 , n pσn=1+i=1nτi2n
    SnasympN(0,np1p).

Aby obliczyć momenty należy zauważyć, że P ( τ 1 = 1 ) = p, a dla m 2 , P ( τ 1 = m ) = ( 1 - p ) 2 p m - 2 . Następnie można zastosować techniki podobne do stosowanych podczas obliczania momentów dla rozkładu geometrycznego. Alternatywnie, jeśli X jest geometryczne z prawdopodobieństwem sukcesu 1 - p, a Z =τ1P(τ1=1)=pm2P(τ1=m)=(1p)2pm2X1pZ=1(τ1=1)1+X(1Z)τ1

NRH
źródło
+1 nice. I would only have written assymptotic distribution for 1/nSn, aby wyraźnie pokazać, że CLT stosuje się w zwykły sposób. Ale to tylko kwestia gustu.
mpiktas
2

Van Belle's 'Rule of Thumb' 8.7 (from the second edition of his book) includes an approximation for the standard error of the mean when innovations have autocorrelation ρ. Translating this using ρ=2p1 gives

True standard error of x¯p1psn,
where nx¯ is the position of the random walk after n steps, and s is the sample standard deviation (which will be, asymptotically in n, 1x¯2. The upshot is that I expect, as a rough approximation, that the standard deviation of nx¯ should be around np/(1p).

edit: I had the wrong autocorrelation (or rather p should have been interpreted differently); is now consistent (I hope!)

shabbychef
źródło
Interesting. I'm not sure that yields anything very sensible for the p=0 subcase; though, that could be due to pathologies associated with that case.
cardinal
@cardinal good catch, the autocorrelation should be ρ=2p1, not 12p. correcting it...
shabbychef