Oto pytanie:
Rzucasz iteracyjnie uczciwymi 6-stronnymi kostkami, aż suma rzutów kostek będzie większa lub równa M. Jakie jest średnie i standardowe odchylenie sumy minus M, gdy M = 300?
Czy powinienem napisać kod, aby odpowiedzieć na tego rodzaju pytania?
Proszę dać mi kilka wskazówek na ten temat. dzięki!
[self-study]
tag i przeczytaj jego wiki . Następnie powiedz nam, co rozumiesz do tej pory, czego próbowałeś i gdzie utknąłeś. Podamy wskazówki, które pomogą Ci się odblokować.Odpowiedzi:
Z pewnością możesz użyć kodu, ale nie symulowałbym.
Zignoruję część „minus M” (możesz to zrobić dość łatwo na końcu).
Można bardzo łatwo obliczyć prawdopodobieństwa rekurencyjnie, ale rzeczywistą odpowiedź (z bardzo wysokim stopniem dokładności) można obliczyć na podstawie prostego rozumowania.
Niech bułki być . Niech .S t = ∑ t i = 1 X iX1,X2,... St=∑ti=1Xi
Niech być najmniejszy wskaźnik gdzie .S τ ≥ Mτ Sτ≥M
podobnie
Równania podobne do pierwszego powyższego można następnie (przynajmniej w zasadzie) cofać, dopóki nie osiągniesz któregokolwiek z warunków początkowych, aby uzyskać algebraiczną zależność między warunkami początkowymi a oczekiwanymi prawdopodobieństwami (co byłoby uciążliwe i niezbyt pouczające) , lub możesz zbudować odpowiednie równania do przodu i uruchomić je z warunków początkowych, co jest łatwe do zrobienia numerycznie (i tak sprawdziłem moją odpowiedź). Możemy jednak tego wszystkiego uniknąć.
Prawdopodobieństwa punktów są ważonymi średnimi wcześniejszych prawdopodobieństw; te (geometrycznie szybko) wygładzą wszelkie zmiany prawdopodobieństwa z początkowego rozkładu (wszelkie prawdopodobieństwo w punkcie zero w przypadku naszego problemu). The
W przybliżeniu (bardzo dokładne) możemy powiedzieć, że do powinny być prawie równie prawdopodobne w czasie (naprawdę blisko), a więc z powyższego możemy zapisać, że prawdopodobieństwa będą bardzo bliscy bycia w prostych stosunkach, a ponieważ muszą być znormalizowane, możemy po prostu zapisać prawdopodobieństwa.M - 1 τ - 1M.- 6 M.- 1 τ- 1
Oznacza to, że widzimy, że gdyby prawdopodobieństwo przejścia od do było dokładnie równe, istnieje 6 jednakowo prawdopodobnych sposobów dotarcia do , 5 do i tak dalej do 1 sposób na dostanie się do .M - 1 M M + 1 M + 5M.- 6 M.- 1 M. M.+ 1 M.+ 5
Oznacza to, że prawdopodobieństwa są w stosunku 6: 5: 4: 3: 2: 1 i sumują się do 1, więc są łatwe do zanotowania.
Dokładne obliczenie go (aż do skumulowanych błędów numerycznego zaokrąglenia) przez uruchomienie rekurencji prawdopodobieństwa do przodu od zera (zrobiłem to w R) daje różnice w kolejności≈
.Machine$double.eps
( na mojej maszynie) od powyższego przybliżenia (to znaczy: proste rozumowanie zgodnie z powyższymi wierszami daje efektywnie dokładne odpowiedzi, ponieważ są one tak bliskie odpowiedziom obliczonym na podstawie rekurencji, jak przypuszczalibyśmy, że dokładne odpowiedzi powinny być).2.22e-16
Oto mój kod do tego (większość po prostu inicjuje zmienne, praca jest w jednym wierszu). Kod zaczyna się po pierwszym rzucie (aby zaoszczędzić mi wpisania komórki 0, co jest niewielką uciążliwością w R); na każdym kroku pobiera najniższą komórkę, którą można zająć, i przesuwa się do przodu za pomocą rzutu kostką (rozkładając prawdopodobieństwo tej komórki na kolejne 6 komórek):
(moglibyśmy użyć
rollapply
(zzoo
), aby zrobić to bardziej wydajnie - lub wielu innych takich funkcji - ale łatwiej będzie to przetłumaczyć, jeśli będę to wyraźnie wyrażać)Zauważ, że
d6
jest to dyskretna funkcja prawdopodobieństwa powyżej 1 do 6, więc kod wewnątrz pętli w ostatnim wierszu konstruuje średnie ważone z wcześniejszych wartości. To właśnie ta relacja sprawia, że prawdopodobieństwo wygładza się (aż do kilku ostatnich wartości, którymi jesteśmy zainteresowani).Oto pierwsze 50 nieparzystych wartości (pierwsze 25 wartości oznaczone kółkami). Przy każdym wartość na osi y reprezentuje prawdopodobieństwo, które zgromadziło się w najbardziej tylnej komórce, zanim przetoczyliśmy ją do następnych 6 komórek.t
Jak widzisz, wygładza się (do , odwrotność średniej liczby kroków, które wykonuje każdy rzut kości) dość szybko i pozostaje stała.1 / μ
A kiedy trafimy w , te prawdopodobieństwa maleją (ponieważ nie przedstawiamy z kolei prawdopodobieństwa dla wartości w i dalej)MM. M.
Zatem oczywiste jest, że idea, że wartości od do powinny być równie prawdopodobne, ponieważ wahania warunków początkowych zostaną wygładzone.M - 6M.- 1 M.- 6
Ponieważ rozumowanie nie zależy od niczego, ale jest na tyle duże, że warunki początkowe wypłukują się, tak że do są prawie równie prawdopodobne w czasie , rozkład będzie zasadniczo taki sam dla każdego duże , jak sugerował Henry w komentarzach.M - 1 M - 6 τ - 1 M.M. M.- 1 M.- 6 τ- 1 M.
Patrząc wstecz, wskazówka Henry'ego (która jest również w twoim pytaniu), aby pracować z sumą minus M zaoszczędziłaby trochę wysiłku, ale argument byłby bardzo podobny. Możesz kontynuować, pozwalając i pisać podobne równania dotyczące z poprzednimi wartościami i tak dalej.R 0Rt= St- M R0
Z rozkładu prawdopodobieństwa średnia i wariancja prawdopodobieństw są wtedy proste.
Edycja: Przypuszczam, że powinienem podać średnią asymptotyczną i odchylenie standardowe pozycji końcowej minus :M.
Średni asymptotyczny nadmiar wynosi a odchylenie standardowe to . Przy jest to dokładne w znacznie większym stopniu, niż możesz się tym przejmować. 2 √53) M=3002 5√3) M.= 300
źródło
W tym miejscu możemy heurystycznie argumentować, że w bardzo dobrym przybliżeniu dla wszystkich oprócz najmniejszych ,Wynika to z tego, że oczekiwana wartość rzutu wynosi a jej odwrotnością powinna być ograniczająca, stabilna długofalowa częstotliwość dowolnej wartości w .M
Rygorystyczny sposób wykazania tego uwzględnia sposób, w jaki może wystąpić . Występuje albo a następny rzut to ; lub występuje, a kolejny rzut był wynikiem ; lub ... lub pojawia się a następny rzut to . To wyczerpujący podział możliwości, skądEi Ei−1 1 Ei−2 2 Ei−6 6
Początkowe wartości tej sekwencji to
Ten wykres stosunku do pokazuje, jak szybko szanse opadają do stałej , pokazanej poziomą przerywaną linią.Pr(Ei) i 2/7
Istnieje standardowa teoria takich sekwencji rekurencyjnych. Można go opracować za pomocą generowania funkcji, łańcuchów Markowa, a nawet manipulacji algebraicznych. Ogólny wynik jest taki, że istnieje formuła zamknięta dla .Pr(Ei) Będzie to liniowa kombinacja stałej i mocy pierwiastków wielomianuith
Największa wielkość tych pierwiastków wynosi około . W reprezentacji zmiennoprzecinkowej podwójnej precyzji jest zasadniczo zerowy. Dlatego dlaexp(−0.314368) exp(−36.05) i≫−36.05/−0.314368=115 2/7
W związku z tym dla , dla wszystkich praktycznych celów możemy przyjąć , skądM=300≫115 EM+k−j=2/7
Obliczenie średniej i wariancji tego rozkładu jest proste i łatwe.
OtoM+5=305 X300−300 χ2 0.1367
R
symulacja potwierdzająca te wnioski. Generuje prawie 100 000 sekwencji przez , zestawia wartości i stosuje test aby ocenić, czy wyniki są zgodne z powyższym. Wartość p (w tym przypadku) jest wystarczająco duża, aby wskazać, że są one spójne.X 300 - 300 χ 2 0,1367źródło