Czy cyfry

33

Załóżmy, że przestrzegasz sekwencji:

7, 9, 0, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 2, 8. ..

Jakie testy statystyczne zastosujesz, aby ustalić, czy to naprawdę przypadek? Do Twojej dyspozycji są te cyfry π . Czy zatem cyfry π są statystycznie losowe? Czy to mówi coś o stałej π ?nπππ

wprowadź opis zdjęcia tutaj

Cam.Davidson.Pilon
źródło
10
To interesujące i denerwujące pytanie. Każdy student, który ukończył pierwszy kurs z prawdopodobieństwa teoretycznego, może łatwo udowodnić, że „prawie wszystkie” liczby rzeczywiste są normalne . Ale znanych jest bardzo niewiele wyraźnych przykładów i, o ile wiem (z ręki), sprawa nie została rozstrzygnięta w żaden sposób dla żadnej ze „słynnych” irracjonalnych stałych matematycznych.
kardynał
4
W (ścisłym) związku z komentarzem @ kardynała: Normalna liczba
6
Jaki jest wykres Jest dziesięć pasków, dziwnie rozmieszczonych, a wszystkie o wartości powyżej 10%!
xan

Odpowiedzi:

5

Odpowiadając tylko na pierwsze pytanie: „Jakie testy zastosowałbyś, aby ustalić, czy ta [sekwencja] jest naprawdę losowa?”

Co powiesz na traktowanie go jako szeregu czasowego i sprawdzanie autokorelacji? Oto trochę kodu R. Najpierw niektóre dane testowe (pierwsze 1000 cyfr):

digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))

Sprawdź liczbę poszczególnych cyfr:

> table(digits)
digits
  0   1   2   3   4   5   6   7   8   9 
 93 116 103 102  93  97  94  95 101 106 

Następnie zamień go w szereg czasowy i uruchom test Box-Pierce:

d=as.ts( digits )
Box.test(d)

co mówi mi:

X-squared = 1.2449, df = 1, p-value = 0.2645

Zazwyczaj chciałbyś, aby wartość p była poniżej 0,05, aby powiedzieć, że istnieją autokorelacje.

Uruchom, acf(d)aby zobaczyć autokorelacje. Nie zamieściłem tutaj zdjęcia, ponieważ jest to nudna mapa, choć ciekawe, że największe opóźnienia występują przy 11 i 22. Biegnij, acf(d,lag.max=40)aby pokazać, że nie ma piku przy opóźnieniu = 33 i że to tylko zbieg okoliczności!


PS Możemy porównać, jak dobrze wypadło 1000 cyfr pi, wykonując te same testy na rzeczywistych liczbach losowych.

probs=sapply(1:100,function(n){
    digits=floor(runif(1000)*10)
    bt=Box.test(ts(digits))
    bt$p.value
    })

Generuje to 1000 losowych cyfr, wykonuje test i powtarza to 100 razy.

> summary(probs)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900 
> sd(probs)
[1] 0.2904346

Tak więc nasz wynik mieścił się w granicach pierwszego odchylenia standardowego, a kwakanie pi jak losowa kaczka. (Użyłem, set.seed(1)jeśli chcesz odtworzyć te dokładne liczby).

Darren Cook
źródło
0

To dziwne pytanie. Liczby nie są losowe.

π

0.1212121212

πππ2222+1ππ

AdamO
źródło
π
π
2
Tak naprawdę nie podążam za tą odpowiedzią. Tak, pi jest stałe, ale ciąg cyfr może nadal zachowywać się jak szereg liczb losowych. Nie rozumiem, jak 0.1212 ... reprezentuje przypadkowość z jakiejkolwiek definicji. Jak zauważyłeś w komentarzu, to, czy pi zawiera dowolną sekwencję cyfr, ma niewielki wpływ na losowy charakter jej cyfr. Po co więc się na tym skupiać?
Nuclear Wang
π
@AdamO Możesz dokonać tej prognozy tylko wtedy, gdy wiesz wcześniej, że liczba, którą opisujesz, to pi, co wydaje się oszustwem. Cyfry w 3.141592 nie wskazują, że następna cyfra to 6; jedyny sposób, w jaki wiesz, to dlatego, że konkretnie opisujemy pi. O ile nie obliczyłeś już liczby pi do N cyfr, nie ma powodu, aby oczekiwać, że cyfra N będzie jakąś konkretną liczbą. Wydaje się, że sugerujesz, że nie ma czegoś takiego jak losowa sekwencja liczb, ponieważ gdy ją zapiszesz, zostanie naprawiona.
Nuclear Wang