John Kerrich Coin-flip Data

12

Czy ktoś może zasugerować, gdzie uzyskać wyniki 10 000 rzutów monetą (tj. Wszystkich 10 000 głów i reszek) wykonanych przez Johna Kerricha podczas II wojny światowej?

Tomasz
źródło
1
Biorąc pod uwagę, że w tym czasie był zamknięty w nazistowskim więzieniu, zastanawiam się, czy miał wystarczająco dużo papieru, aby zapisać wszystkie 10 000 wyników, czy tylko faktycznie spisał wartości podsumowujące.
Corone,
6
Wyniki @Coreone 10K można łatwo zapisać na jednym standardowym arkuszu papieru, używając, powiedzmy, kropki i kodu kreskowego (jak w ||||..|....||.|..||.etc). Można to skompresować za pomocą (na przykład) systemu szesnastkowego. W poprzednim przykładzie, przyjmując |1 i .0, reprezentacja szesnastkowa to f21a6. Pisząc małe, ale widoczne znaki, mogę z łatwością zmieścić 50 takich znaków w jednej linii pisania i 50 linii na arkuszu, reprezentując w ten sposób sekwencję 50 * 50 * 4 = 10 000 wyników.
whuber
2
@ whuber haha, tak, zacząłem rozważać podobne rzeczy po moim komentarzu. Wątpię, aby w erze komputerów wstępnych pojawił się szesnastkowy, podobnie jak teraz, choć ósemka wciąż dawałaby ci szansę. Nadal jednak spróbowałem i kropki i kreski sam mogłem uzyskać więcej niż 100 na arkuszu, więc jeśli użyłby obu stron, 10K prawie by pasowało. Może dlatego zatrzymał się na 10K!
Corone
Nazistowskie więzienie, tak, ale w Danii nie był to obóz zagłady ...
kjetil b halvorsen
@kjetilbhalvorsen - w rzeczywistości duński obóz jeniecki w Hald z duńskimi strażnikami itp. w celu ochrony internowanych przed Niemcami
Henry

Odpowiedzi:

13

Nie słyszałem wcześniej o Kerrichu - co za dziwna historia. Skanowanie książek Google (udostępnione przez reftt) „Eksperymentalne wprowadzenie do teorii prawdopodobieństwa” wydaje się nie zawierać treści tekstu. Czując się trochę staroświeckim, sprawdziłem egzemplarz wydania z 1950 r. Z biblioteki.

Zeskanowałem kilka stron, które uznałem za interesujące. Strony opisują jego warunki testowe, dane z pierwszych 2000 rzutów monetą oraz dane z pierwszych 500 z serii 5000 równie nieprawdopodobnie brzmiących eksperymentów z urną (z 2 czerwonymi i 2 zielonymi piłeczkami ping-pongowymi).


Rozpoznawanie tekstu (i pewne czyszczenie) za pomocą Mathematica 9 daje tę sekwencję 2000 ogonów (0) i głów (1) z Tabeli 1. Liczba głowic 1014 to jeden więcej niż 502 + 511 = 1013 w Tabeli 2, więc rozpoznanie było niedoskonały, ale wygląda całkiem nieźle - przynajmniej ma odpowiednią liczbę znaków! (Zachęcamy czytelników o jasnych oczach do poprawienia tego.)

Oto graficzne podsumowanie tego losowego marszu, a następnie same dane. Skumulowana różnica między liczbą głów i ogonów przebiega od lewej do prawej, obejmując wszystkie 2000 wyników.

Postać

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111
Bill Bradley
źródło
3
Nie ma za co. Nałożyłem wykres tych danych na zeskanowany obraz, mając nadzieję, że spowodowałoby to oczywiste rozbieżności, ale nie jestem w stanie znaleźć żadnych różnic. Albo nie ma błędów i Kerrich błędnie przeliczył, albo po prostu nie mogę znaleźć błędu, ale w każdym razie zamieszczone tutaj dane są dokładnym renderowaniem tekstu jego Tabeli 1.
whuber
4

Ta prezentacja pokazuje dane dla ustawionych interwałów rzutów. Odwołuje się także do głównego źródła z Kerrich.


źródło
2
Źródłem (podsumowujących) danych w tej prezentacji są Freedman, Pisani i Purves Statistics (dowolne wydanie). Jest to jednak tylko podsumowanie, a nie konto wszystkich wymaganych tutaj wyników. Kerrich opublikował swoje wyniki w 1946 r. W małej książce; Google go zdigitalizował .
whuber
Tak jak powiedziałem, zawiera dane dotyczące „interwałów rzutów”, a prezentacja odwołuje się do monografii Kerricha, w której opublikował swoje wyniki. Nie wiem, czy Kerrich opublikował swoją listę każdego rzutu. Stwierdziłem, że było to co najmniej bardziej pomocne niż tylko ogólny odsetek.
@ whuber: tak, to była monografia wymieniona w prezentacji. wydaje się mieć ograniczoną dostępność. czy ktoś znalazł pdf?
2

Jest jeszcze inne odniesienie do Kerricha w książce „Chance Meetings: A First Course in Data Analysis and Inference” autorstwa Chrisa Wilda i George'a Sebera, która mówi w rozdziale 4 (można pobrać suplement z tej strony ), że dane są opublikowane w Kerrich [1964] i Freedman [1991, Tabela 1, s. 1] 248]. Książka Kerricha jest prawdopodobnie eksperymentalnym wprowadzeniem do teorii prawdopodobieństwa , a Freedman to ten sam podręcznik, o którym już wspomniano. Wątpię jednak, czy monografia z 1964 r. Zawierałaby więcej danych niż monografia z 1946 r.

reftt
źródło
2

Tę książkę Kerricha można kupić w Amazon, ale podana cena jest raczej sztywna!

Lepszą opcją jest https://openlibrary.org.
Musisz tam założyć konto, a następnie zainstalować Adobe Digital Editions do czytania książki. (wygląda na to, że żaden inny program tego nie zrobi, pobrana książka ma DRM, cyfrowe zarządzanie ograniczeniami). Następnie możesz pobrać („pożyczyć”) książkę. Właśnie to czytam. Chyba mogę zrobić zrzut ekranu stron z wynikami i użyć ocr na tym. Na później ...

(Nie, przejrzałem szybko książkę, wydaje się, że tylko pierwsze 2000 rzutów podaje się indywidualnie, ale istnieje wiele różnorodnych tabel z podsumowaniami rzutów. Są też tabele dla innych eksperymentów, takich jak rysowanie piłek z urny , w tym samym duchu.

kjetil b halvorsen
źródło
3
Nie jest jasne, czy zauważyłeś, że pierwsze 2000 indywidualnych wyników jest już dostępnych w tym wątku przy odpowiedzi Billa Bradleya . Książka pojawia się w książkach Google; Podałem link w innym komentarzu . Obecnie Google prowadzi do innych księgarń, oprócz Amazon, gdzie podana cena (w tym koszty wysyłki) jest znacznie niższa.
whuber
Dzięki, zauważyłem 2000 tosów tam, gdzie były one dostępne powyżej, ale miałem nadzieję, że znajdę więcej w samej książce. Nie wydaje się. Nie mogę czytać książki za pośrednictwem książek Google, może ten dostęp zależy od położenia geograficznego? Nawiasem mówiąc, teraz zwróciłem moją pożyczkę z biblioteki openlibrary, aby inni mogli spróbować ...
kjetil b halvorsen
1
Próbowałem tego samego, gdy pojawił się ten wątek, z tymi samymi negatywnymi skutkami. :-( Nie miałem na myśli intymności, że możemy czytać wersję na książkach Google: jest to tylko rodzaj wyszukiwania. Główną wartością GB (przynajmniej do czasu zmiany zasad Google) jest udostępnianie linków do miejsc, w których moglibyśmy ją kupić.
whuber
1

Natknąłem się na to, przeprowadzając podstawowe badania dotyczące Kerricha. Wziąłem dane z odpowiedzi Billa Bradleya - naprawdę doceniam, że dane zostały zdigitalizowane! Dodałem dane do pakietu R, którego używam do nauczania, który jest dostępny na GitHub .

Chris Prener
źródło