Pracuję nad nauką prawdopodobieństwa i statystyki, czytając kilka książek i pisząc kod, a podczas symulacji rzutu monetą zauważyłem coś, co uderzyło mnie nieco jako sprzeczne z naiwną intuicją. Jeśli rzucisz uczciwą monetę razy, stosunek główek do reszka zbiega się w kierunku 1, gdy wzrasta, dokładnie tak, jak można się spodziewać. Ale z drugiej strony, gdy wzrasta, wydaje się, że stajesz się mniej prawdopodobne, aby rzucić dokładnie taką samą liczbę głów jak ogony, uzyskując w ten sposób stosunek dokładnie 1.
Na przykład (niektóre dane wyjściowe z mojego programu)
For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)
Moje pytanie brzmi: czy istnieje koncepcja / zasada w statystyce / teorii prawdopodobieństwa, która to wyjaśnia? Jeśli tak, to jaka to zasada / koncepcja?
Link do kodu, jeśli ktoś jest zainteresowany tym, jak to wygenerowałem.
-- edytować --
Dla tego, co jest warte, oto, jak wcześniej sobie to tłumaczyłem. Jeśli uczciwą monetę razy i liczbę głów, generujesz w zasadzie liczbę losową. Podobnie, jeśli robisz to samo i liczysz ogony, generujesz także liczbę losową. Więc jeśli oba, tak naprawdę generujesz dwie liczby losowe, a gdy staje się większy, liczby losowe stają się większe. Im większe są generowane losowe liczby, tym większe są szanse, że się „zatęsknią”. Interesujące jest to, że dwie liczby są w pewnym sensie połączone, a ich stosunek zbliża się do jednej, gdy stają się większe, mimo że każda liczba jest losowa w oderwaniu. Może to tylko ja, ale uważam, że to miłe.
źródło
Odpowiedzi:
Zauważ, że przypadek, w którym liczba głów i liczba ogonów są równe, jest taki sam jak „dokładnie połowa czasu, w którym dostajesz głowy”. Trzymajmy się więc liczenia liczby głów, aby sprawdzić, czy jest to połowa liczby rzutów, czy równoważne porównanie proporcji głów z 0,5.
Im więcej przerzucisz, tym większa liczba możliwych głowic, jakie możesz mieć - rozkład staje się bardziej rozłożony (np. Przedział liczby głowic zawierający 95% prawdopodobieństwa będzie się powiększał wraz ze wzrostem liczby rzutów) , więc prawdopodobieństwo, że dokładnie połowa głów spadnie, gdy będziemy rzucać więcej.
Odpowiednio, proporcja głowic przyjmie więcej możliwych wartości; patrz tutaj, gdzie przechodzimy od 100 rzutów do 200 rzutów:
Przy 100 rzutach możemy zaobserwować proporcję 0,49 głów lub 0,50 głów lub 0,51 głów (i tak dalej - ale nic pomiędzy tymi wartościami), ale przy 200 rzutach możemy zaobserwować 0,49 lub 0,495 lub 0,50 lub 0,505 lub 0,510 - prawdopodobieństwo ma więcej wartości do „pokrycia”, a więc każda będzie miała tendencję do uzyskania mniejszego udziału.
Zastanów się, czy masz rzuty z pewnym prawdopodobieństwem zdobycia główek (znamy te prawdopodobieństwa, ale nie jest to krytyczne dla tej części) i dodajesz jeszcze dwa rzuty. W rzutach najbardziej prawdopodobnym rezultatem jest głów ( i stamtąd spada).p i i 2 n n p n > p n ± 12n pi i 2n n pn>pn±1
Jaka jest szansa, że główek na rzuty?2 n + 2n+1 2n+2
(Oznacz te prawdopodobieństwa , abyśmy nie pomylili ich z poprzednimi; niech również P (HH) będzie prawdopodobieństwem „Head, Head” w następnych dwóch rzutach i tak dalej)q
tzn. jeśli dodasz jeszcze dwa rzuty monetami, prawdopodobieństwo średniej wartości naturalnie spada, ponieważ uśrednia najbardziej prawdopodobną (środkową) wartość ze średnią mniejszych wartości po obu stronach)
Tak długo, jak czujesz się komfortowo, że szczyt będzie w środku (dla ), prawdopodobieństwo dokładnie połowy głów musi maleć wraz ze wzrostem .n2n=2,4,6,... n
W rzeczywistości możemy pokazać, że dla dużych , zmniejsza się proporcjonalnie z (co nie jest zaskoczeniem, ponieważ rozkład znormalizowanej liczby głów zbliża się do normalności, a wariancja proporcji głów zmniejsza się z ).p n 1n pn n1n√ n
Zgodnie z życzeniem, oto kod R, który wytwarza coś zbliżonego do powyższego wykresu:
źródło
Dobrze wiemy, że Prawo Dużych Liczb jest tym, co gwarantuje pierwsze zakończenie twojego eksperymentu, a mianowicie, że jeśli rzucisz uczciwą monetę razy, stosunek główek do reszek zbiegnie się w kierunku 1, gdy wzrasta. nn n
Więc nie ma problemów. Jednak to o całym prawie wielkich liczb mówi nam w tym scenariuszu.
Ale teraz pomyśl o tym problemie bardziej intuicyjnie. Pomyśl o rzucie monetą kilka razy, na przykład: .n=2,4,8,10
Kiedy rzucisz monetą dwa razy, tj. , pomyśl o możliwych scenariuszach dwóch rzutów. (Tutaj będzie oznaczać głowy, a będzie oznaczać ogony). Z drugiej pięści można zdobyć a na drugiej klapce można zdobyć . Ale to tylko jeden ze sposobów, w jaki mogły pojawić się dwa koziołki. Mógłbyś także dostać się na pierwszy rzut i drugi rzut oraz na wszystkie inne możliwe kombinacje. Na koniec dnia, gdy rzucisz 2 monety, możliwe kombinacje, które możesz zobaczyć na dwóch rzutach, to więc istnieją 4 możliwe scenariusze dla rzutu monetyH T H T T H S = { H H , H T , T H , T T } n = 2n=2 H T H T T H
Gdybyś 4 monetami, możliwą liczbą kombinacji, które można by zobaczyć, byłoby więc istnieje 16 możliwych scenariuszy przerzucania monet.n = 4
Odrzucenie monet prowadzi do 256 kombinacji.n=8
Odrzucenie monet prowadzi do 1024 kombinacji.n=10
W szczególności przerzucenie dowolnej liczby monet prowadzi do możliwych kombinacji.2 nn 2n
Teraz spróbujmy podejść do tego probabilistycznego punktu widzenia. Patrząc wstecz na przypadek, gdy , wiemy, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów (tj., Jak podajesz stosunek dokładnie 1), wynosi Gdy , wiemy, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów wynosi P r ( stosunek dokładnie 1 ) = 2n=2 n=4Pr(stosunek dokładnie 1)=6
Ogólnie rzecz biorąc, ponieważ ma tendencję do powiększania się, mamy prawdopodobieństwo, że prawdopodobieństwo uzyskania dokładnie takiej samej liczby głów i ogonów wynosi 0.n
Innymi słowy, jako , mamy tenn → ∞
I tak, aby odpowiedzieć na twoje pytanie. Naprawdę to, co obserwujesz, jest tylko konsekwencją faktu, że będzie znacznie więcej kombinacji rzutów monetą, w których liczba głów i ogonów nie będzie równa w porównaniu z liczbą kombinacji, w których są one równe.
Jak sugeruje @Mark L. Stone, jeśli czujesz się swobodnie ze wzorem dwumianowym i dwumianowymi zmiennymi losowymi, możesz użyć tego, aby wyświetlić ten sam argument.
Niech będzie liczbą głów zarejestrowaną przy rzucie rzetelną monetą razy. możemy uznać za zmienną losową pochodzącą z rozkładu dwumianowego, tj. (tutaj przyjmujemy ponieważ mamy do czynienia z uczciwą monetą), a następnie prawdopodobieństwo uzyskania dokładnie taka sama liczba głów jak liczba ogonów (tj. stosunek dokładnie 1) wynosiX n X X∼ B i n ( n , p = 0,5 ) p = 0,5
Teraz ponownie, gdy ma tendencję do powiększania się, powyższe wyrażenie zmierza w kierunku 0, ponieważ jako .n (nn/2)0.5n→0 n→∞
źródło
Zobacz trójkąt Pascala .
Prawdopodobieństwo wyników rzutu monetą jest reprezentowane przez liczby wzdłuż dolnego rzędu. Wynik równych głów i ogonów to środkowa liczba. Gdy drzewo rośnie (tj. Więcej przewrotów), środkowa liczba staje się mniejszą częścią sumy dolnego rzędu.
źródło
Może pomaga to wyjaśnić, że jest to związane z prawem łuczniczym. Mówi, że dla jednej ścieżki wyników prawdopodobieństwo, że ścieżka pozostanie przez większość czasu w domenie dodatniej lub ujemnej, jest znacznie wyższe niż że idzie w górę i w dół, niż można się spodziewać po intuicji . Oto kilka linków:
http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml
https://en.wikipedia.org/wiki/Arcsine_law
źródło
Podczas gdy stosunek głów do ogonów jest zbieżny do 1, zakres możliwych liczb staje się szerszy. (Tworzę liczby). Powiedzmy, że na 100 rzutów prawdopodobieństwo wynosi 90%, że masz od 45% do 55% głów. To 90%, że masz od 45 do 55 głów. 11 możliwości dla liczby głowic. Około 9% mniej więcej tyle samo głów i ogonów.
Powiedzmy, że na 10 000 rzutów prawdopodobieństwo wynosi 95%, że dostaniesz od 49% do 51% głów. Więc stosunek ten zbliżył się znacznie do 1. Ale teraz masz od 4,900 do 5 100 główek. 201 możliwości. Szansa na równe liczby wynosi tylko około 0,5%.
A dzięki milionowi rzutów masz pewność, że masz od 49,9% do 50,1% głów. Jest to zakres od 499,000 do 501 000 sztuk. 2100 możliwości. Szansa jest teraz ograniczona do 0,05%.
Ok, matematyka została wymyślona. Ale to powinno dać ci wyobrażenie o tym „dlaczego”. Chociaż stosunek zbliża się do 1, liczba możliwości staje się większa, tak więc trafienie dokładnie w połowie głowy, w połowie ogona staje się coraz mniej prawdopodobne.
Kolejny praktyczny efekt: w praktyce jest mało prawdopodobne, abyś miał monetę, w której prawdopodobieństwo rzucenia głowami wynosi dokładnie 50%. Może to być 49,99371%, jeśli masz naprawdę dobrą monetę. W przypadku małej liczby rzutów nie ma to znaczenia. W przypadku dużych liczb odsetek głów zbiega się do 49,99371%, a nie 50%. Jeśli liczba rzutów jest wystarczająco duża, rzucanie 50% lub więcej głów stanie się bardzo, bardzo mało prawdopodobne.
źródło
Cóż, należy zauważyć, że przy parzystej liczbie przewrotów (w przeciwnym razie prawdopodobieństwo równych przewrotów głowami i ogonami wynosi oczywiście dokładnie zero), najbardziej prawdopodobnym rezultatem zawsze będzie ta, która ma tyle tylu przewrotów głowami, co przewrotów ogonów.
Rozkład rzutów jest podawany przez współczynniki wielomianu Zatem dla parzystego prawdopodobieństwo wynosin
Używanie aproksymacji Stirlinga dla, dochodzisz do czegoś takiego jak dla prawdopodobieństwa dokładnie przewrotek (i odpowiednio ogonów) dla ogólnych rzutów. Tak więc absolutne prawdopodobieństwo tego wyniku jest zbieżne z 0, ale znacznie wolniejsze niż większość innych wyników, przy ekstremalnych przypadkach 0 przewrotek (lub alternatywnie 0 ogonów) wynosi .n !
źródło
Załóżmy, że rzucisz monetą dwa razy. Istnieją cztery możliwe wyniki: HH, HT, TH i TT. W dwóch z nich masz taką samą liczbę głów i ogonów, więc istnieje 50% szans, że otrzymasz taką samą liczbę głów i ogonów.
Załóżmy teraz, że rzuciłeś monetą 4 306 492 102 razy. Czy spodziewasz się 50 procent szans, że skończysz z dokładnie 2 153 246 051 głowami i 2 153 246 051 ogonami?
źródło