Ile razy muszę rzucić kostką, aby pewnie ocenić jej rzetelność?

22

(Z góry przepraszamy za użycie języka świeckiego zamiast języka statystycznego).

Jeśli chcę zmierzyć szanse na rzut każdej strony konkretnej fizycznej sześciościennej kostki do około +/- 2% z rozsądną pewnością, ile próbnych rzutów byłoby potrzebne?

tj. ile razy musiałbym rzucić kostką, licząc każdy wynik, aby mieć 98% pewności, że szanse, że rzuci każdą stroną, wynoszą 14,6% - 18,7%? (Lub niektóre podobne kryteria, w których około 98% byłoby przekonanych, że kość jest sprawiedliwa w granicach 2%)

(Jest to rzeczywista obawa w przypadku gier symulacyjnych wykorzystujących kości i chcących mieć pewność, że pewne projekty kostek są akceptowalnie zbliżone do 1/6 szansy na wyrzucenie każdej liczby. Istnieją twierdzenia, że wiele popularnych projektów kostek zostało zmierzonych, rzucając 29% 1 na rzucając kilkoma takimi kostkami 1000 razy).

Dronz
źródło
1
Jest to o wiele trudniejsze niż znalezienie przedziału ufności dla dwumianu, ponieważ chciałbyś zachować wszystkie prawdopodobieństwa pod kontrolą. Zobacz artykuł Hsiuying Wanga na temat równoczesnych przedziałów ufności dla rozkładów wielomianowych ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). Możesz znaleźć kod w tym poście na blogu , który zawiera także krótkie podsumowanie niektórych prac, które zostały wykonane w tym temacie.
idnavid,
1
Zauważ, że jeśli jesteś zainteresowany tylko sprawdzeniem, czy jedne są rzucane przez dość długi czas, bardzo upraszcza to pytanie.
Dennis Jaheruddin
2
Należy zauważyć, że „przedział ufności” nie daje „procentowego prawdopodobieństwa bycia poprawnym”. Podejrzewam, że używasz bardzo rozsądnego powszechnego użycia terminu „98% pewności”, ale musisz wiedzieć za każdym razem, gdy ktoś wspomina o „przedziale ufności”, który wcale nie jest taki sam jak prawdopodobieństwo
BrianH
1
@BrianH Dziękujemy! Nie chodziło mi tylko o wyrażenie kolokwialne, ale staram się określić ilościowo pewność wynikającą z testu. Wydaje mi się, że w taki sam sposób, w jaki ma sens powiedzenie, że spodziewam się rzucić jakimś wynikiem rzutu w obliczalny procent czasu, że istniałoby podobne (ale bardziej złożone) obliczenie dla tego, jak prawdopodobne jest wyrzucenie wyników w ciągu pewien margines błędu w rzucie n razy, co myślę, że rozumiem odpowiedź Xiamoi (i komentarz uzupełniający). Tak?
Dronz
1
@Dronz Szczerze mówiąc, jest to jedna z tych rzeczy, które naprawdę uważasz, że byłyby bardziej proste, niż się okazują. Diabelnie trudne. Oto kilka kluczowych pytań powiązanych gdzie indziej, które pomogą Ci zrozumieć, jak nie ma niewiarygodnie prostej odpowiedzi: Frequentist math.stackexchange.com/questions/1578932/... Bayesian math.stackexchange.com/questions/1584833/... i zabawa: rpg.stackexchange.com/questions/70802/…
BrianH

Odpowiedzi:

18

TL; DR: jeśli p = 1/6 i chcesz wiedzieć, jak duże n musi wynosić 98%, to znaczy, że kości są w porządku (do 2%), n musi wynosić co najmniej n ≥ 766 .


Niech n będzie liczbą rzutów, a X liczbą rzutów, które wylądują na określonej stronie. Następnie X następuje po rozkładzie dwumianowym (n, p), gdzie p jest prawdopodobieństwem uzyskania określonej strony.

Po centralnym twierdzeniu o granicy wiemy o tym

n(X/np)N(0,p(1p))

Ponieważ X/n jest średnią próbną n losowych zmiennych Bernoulliego (p) . Stąd dla dużych n przedziały ufności dla p można skonstruować jako

Xn±Zp(1p)n

Ponieważ p jest nieznany, możemy zastąpić go z próbki średniej p = X / n , i przez różnych twierdzeń konwergencji, wiemy uzyskany przedział ufności będzie asymptotycznie ważny. Otrzymujemy więc przedziały ufności formularzap^=X/n

p^±Zp^(1p^)n

z p = X / n . Mam zamiar założyć wiesz co Z -Wyniki są. Na przykład, jeśli chcesz mieć 95% przedział ufności, przyjmujesz Z = 1,96 . Tak więc dla danego poziomu ufności α mamyp^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Powiedzmy teraz, że chcesz, aby ten przedział ufności był mniejszy niż Cα i chcesz wiedzieć, jak duża próbka jest potrzebna do wykonania tego przypadku. Odpowiada to pytaniu, co nα spełnia

Zαp^(1p^)nαCα2

Który jest następnie rozwiązany w celu uzyskania

nα(2ZαCα)2p^(1p^)

Tak więc podłączyć wartościami Zα , Cα oraz oszacowania P , aby uzyskać oszacowanie n alfa . Zauważ, że ponieważ p nie jest znane, jest to tylko oszacowanie, ale asymptotycznie (gdy n staje się większe), powinno być dokładne.p^nαpn

Xiaomi
źródło
3
Dzięki. Ponieważ od dziesięcioleci nie zajmowałem się matematyką typu college'owego, czy mogę sprawić kłopoty z podłączeniem liczb i faktycznie dać mi pole do gry, ile razy muszę rzucić kostką jako liczbę całkowitą?
Dronz
9
p=1/6nnn766Cα
4
Bardziej interesujące może być spojrzenie na rozkład wielomianowy, ponieważ teraz testujemy dla każdej strony osobno. Nie uwzględnia to wszystkich informacji o problemie. Intuicyjne wyjaśnienie znajduje się na stronie stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
stycznia
5
Zgadzam się z @Jan: Ta odpowiedź nie dotyczy pytania. Co więcej, nie można go łatwo dostosować do konstruowania odpowiedzi poprzez zastosowanie jej osobno do wszystkich sześciu twarzy, ponieważ sześć testów jest od siebie zależnych.
whuber
3
To ładna odpowiedź, ale w pełni zgadzam się z @Jan, whuber. To pytanie zasługuje na odpowiedź opartą na statystyce chi-kwadrat i rozkładzie wielomianowym.
Łukasz Grad