Czy powinienem używać dwumianowego cdf lub normalnego cdf podczas przerzucania monet?

11

Moneta musi zostać przetestowana pod kątem uczciwości. 30 głów pojawia się po 50 rzutach. Zakładając, że moneta jest sprawiedliwa, jakie jest prawdopodobieństwo, że zdobędziesz co najmniej 30 głów w 50 rzutach?

Według mojego nauczyciela właściwym sposobem rozwiązania tego problemu jest zrobienie tego

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Jednak wziąłem dwumianową funkcję skumulowanego rozkładu w ten sposób

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Uważam, że spełnione są kryteria rozkładu dwumianowego: poszczególne zdarzenia są niezależne, istnieją tylko dwa możliwe wyniki (głowy kontra ogony), prawdopodobieństwo jest stałe dla pytania (0,5), a liczba prób jest ustalona na 50 Jednak oczywiście dwie metody dają różne odpowiedzi, a symulacja wspiera moją odpowiedź (przynajmniej kilka razy ją uruchomiłem; oczywiście nie mogę zagwarantować, że uzyskasz takie same wyniki).

Czy mój nauczyciel myli się, zakładając, że normalna krzywa rozkładu byłaby również prawidłowym sposobem rozwiązania tego problemu (w żadnym momencie nie jest powiedziane, że rozkład jest normalny, ale zarówno n * p, jak i n * (1-p) są większe niż 10), czy też źle zrozumiałem rozkład dwumianowy?

waiwai933
źródło
5
Osoba z doświadczeniem w stosowaniu przybliżeń normalnych do dwumianu postąpiłaby nieco inaczej: zastosowałaby (zwykłą) korektę ciągłości , jak w 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(to jest wyrażenie R), której wartość wynosi 0,1015, w dość ścisłej zgodności z dwumianowym cdf .
whuber

Odpowiedzi:

10

Oto ilustracja odpowiedzi whuber i onestop.

korekta ciągłości

Na czerwono rozkład dwumianowy , na czarno gęstość normalnego przybliżenia , a na niebiesko powierzchnia odpowiadająca dla .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

Wysokość czerwonego paska odpowiadającego dla jest dobrze przybliżona przez . Aby uzyskać dobre przybliżenie , musisz użyć .P(X=k)XBin(50,0.5)P(X30)P(Y>29,5)P(k12<Y<k+12)P(X30)P(Y>29.5)

(edytuj) To jest (uzyskany w R przez ), podczas gdy przybliżenie jest prawidłowe.P ( X 30 ) 0,1013194 :

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

Nazywa się to korektą ciągłości . Pozwala obliczyć nawet „prawdopodobieństwa punktowe”, takie jak : P ( X = 22 )P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.
Elvis
źródło
4

Rozkład normalny daje dokładniejsze przybliżenie do dwumianu, jeśli zastosujesz korektę ciągłości . Korzystając z tego na twój przykład, otrzymuję 0,1015. Ponieważ jest to praca domowa, pozostawię ci wypełnienie szczegółów.

jeden przystanek
źródło
4

Rozważ to. W dyskretnym rozkładzie dwumianowym masz rzeczywiste prawdopodobieństwa dla poszczególnych liczb. W ciągłej normalnej tak nie jest, potrzebujesz zakresu wartości. Więc ... jeśli zamierzasz przybliżyć prawdopodobieństwo pojedynczej wartości, powiedzmy X, z dwumianu z normalną, jak byś to zrobił? Spójrz na histogram prawdopodobieństwa rozkładu dwumianowego z nałożoną na niego krzywą normalną. Musisz właściwie wybrać X ± 0,5, aby uchwycić coś podobnego do prawdopodobieństwa dwumianowego X przy normalnym przybliżeniu.

Rozwiń to teraz, gdy wybierasz ogon dystrybucji. Kiedy używasz metody dwumianowej, wybierasz prawdopodobieństwo całej wartości (w twoim przypadku 30) plus wszystko wyższe. Dlatego, gdy wykonujesz ciągłość, musisz upewnić się, że ją przechwytujesz i wybierasz również 0,5 mniej, więc odcięcie w ciągłym rozkładzie wynosi 29,5.

Jan
źródło
3
W rzeczywistości pytanie to dobrze rozumie problem i wydaje się, że nie szuka odpowiedzi na rutynowe pytanie domowe. Chociaż jest to praca domowa oznaczona etykietą , rozważ tutaj wyjątek. W szczególności dobra dyskusja na temat wykorzystania rozkładu normalnego do przybliżenia rozkładów dyskretnych (takich jak dwumianowe i Poissony z dużymi liczbami N) byłaby tutaj właściwa i bardzo mile widziana.
whuber