Zadano mi to pytanie z w wywiadzie. Czy istnieje „poprawna” odpowiedź?
Załóżmy, że rzuty są identyczne, a prawdopodobieństwo głów wynosi . Rozkład liczby głów w 400 rzutach powinien następnie być zbliżony do normalnego (200, 10 ^ 2), tak aby 220 głów było o 2 standardowe odchylenia od średniej. Prawdopodobieństwo zaobserwowania takiego wyniku (tj. Więcej 2 SD od średniej w obu kierunkach) wynosi nieco mniej niż 5%.
Ankieter powiedział mi zasadniczo: „jeśli zaobserwuję coś> = 2 SD od średniej, dochodzę do wniosku, że dzieje się coś innego. Obstawiłbym, że moneta jest uczciwa”. To rozsądne - w końcu to właśnie robi większość testów hipotez. Ale czy to koniec historii? Dla ankietera była to „poprawna” odpowiedź. Pytam tutaj, czy jakiś niuans jest uzasadniony.
Nie mogłem nie wspomnieć, że stwierdzenie, że moneta jest niesprawiedliwa, jest dziwnym wnioskiem w tym kontekście rzucania monetą. Czy mam rację, że tak mówię? Spróbuję wyjaśnić poniżej.
Przede wszystkim ja - i przypuszczam, że większość ludzi - mam mocne zdanie o monetach: najprawdopodobniej będą uczciwe. Oczywiście zależy to od tego, co rozumiemy przez „sprawiedliwy” - jedną z możliwości byłoby zdefiniowanie „sprawiedliwego” jako „o prawdopodobieństwie„ zbliżenia ”głów do 0,5, powiedzmy między 0,49 a 0,51”.
(Można również zdefiniować „fair” w ten sposób, że prawdopodobieństwo głowy jest dokładnie 0,50, w którym to przypadku konieczności doskonale sprawiedliwy moneta wydaje się raczej un prawdopodobne).
Twój przeor może zależeć nie tylko od twoich ogólnych przekonań na temat monet, ale także od kontekstu. Jeśli wyciągniesz monetę z własnej kieszeni, możesz być praktycznie pewien, że jest sprawiedliwa; jeśli twój przyjaciel magik wyciągnie go ze swojego, twój przeor może przyłożyć większą wagę do monet dwugłowych.
W każdym razie łatwo jest wymyślić rozsądne priory, które (i) stawiają duże prawdopodobieństwo uczciwości monety i (ii) prowadzą twój tyłek do całkiem podobnego, nawet po zaobserwowaniu 220 głów. Doszedłbyś do wniosku, że moneta najprawdopodobniej była sprawiedliwa, pomimo zaobserwowania wyniku 2 SD od średniej.
W rzeczywistości możesz również skonstruować przykłady, w których obserwowanie 220 głów w 400 rzutach sprawia, że twój tylny kładzie większy nacisk na uczciwość monety, na przykład jeśli wszystkie nieuczciwe monety mają prawdopodobieństwo głów w .
Czy ktoś może rzucić na to trochę światła?
Po napisaniu tego pytania przypomniałem sobie, że słyszałem wcześniej o tej ogólnej sytuacji - czy to nie „paradoks” Lindleya ?
Whuber umieścił w komentarzach bardzo interesujący link: możesz załadować kostkę , ale nie możesz nastawiać monety . Od strony 3:
Nie ma sensu stwierdzać, że moneta ma prawdopodobieństwo p głów, ponieważ można ją całkowicie określić na podstawie sposobu, w jaki jest rzucana - chyba że zostanie rzucona wysoko w powietrze z szybkim wirowaniem i złapana w powietrze za pomocą bez podskakiwania, w którym to przypadku p = 1/2.
Całkiem fajne! To wiąże się z moim pytaniem w ciekawy sposób: załóżmy, że wiemy, że moneta „jest rzucana wysoko w powietrze z gwałtownym obrotem i chwytana w powietrze bez podskakiwania”. Zatem zdecydowanie nie powinniśmy odrzucać hipotezy, że moneta jest uczciwa (gdzie „sprawiedliwy” oznacza teraz „posiadanie p = 1/2 przy rzuceniu w sposób opisany powyżej”), ponieważ faktycznie dysponujemy pierwszeństwem, które stawia wszelkie prawdopodobieństwo na monety są uczciwe. Może to w pewnym stopniu uzasadnia, dlaczego nie czuję się dobrze odrzucając zero po zaobserwowaniu 220 głów.
Odpowiedzi:
Standardowym bayesowskim sposobem rozwiązania tego problemu (bez normalnych przybliżeń) jest wyraźne określenie swojego przeora, połączenie go z prawdopodobieństwem, które jest rozpowszechniane w wersji beta. Następnie zintegruj swój tył około 50%, powiedz dwa odchylenia standardowe lub 49–51% lub cokolwiek zechcesz.
Jeśli twoje wcześniejsze przekonanie jest ciągłe w stosunku do [0,1] - np. Beta (100,100) (ta stawia dużą masę na mniej więcej uczciwych monetach) - prawdopodobieństwo, że moneta jest uczciwa, wynosi zero, ponieważ prawdopodobieństwo jest również ciągłe [0 , 1].
Nawet jeśli prawdopodobieństwo, że moneta jest uczciwa, wynosi zero, zwykle możesz odpowiedzieć na każde pytanie, na które miałbyś odpowiedzieć, z powodu uprzedzenia. Na przykład, jaka jest przewaga kasyna, biorąc pod uwagę rozkład późniejszy prawdopodobieństw monet.
źródło
Powiedzmy dla Dystrybucji Bernoulliego, w tym przypadku rzutu monetą.
Oczywiście jest to rozkład dwumianowy i rzeczywiście jest zbliżony do .B(n=400,p=0.5) N(μ=200,σ2=100)
Oczywiście ankieter pyta o wynik przy przedziale ufności dla lub wartość .k 95% B(n=400,p=0.5) p B(n=400,p=0.5,k=220)
W podejściu bayesowskim twoim przełożeniem jest to, że zamiast ip=0.5 π(p=0.5)=0.5 π(p≠0.5)=0.5
Użyjmy jeszcze bardziej sprawiedliwego wcześniej, że i . Zakładamy, że ma rozkład równomierny w każdym przedziale.π(0.49≤p≤0.51)=0.9 π(p<0.49∪p>0.51)=0.1 p
Następnie możemy obliczyć tylne .P(0.49≤p≤0.51|k=220)
Lub bardzo prawdopodobne, że wcześniejszy jest rozkładem normalnym ~ , lub możemy założyć znacznie mniejszą wariancję, taką jak .p N(μ=0.5,σ2=0.25) σ2=0.1
Następnie obliczamy rozkład tylny jako .p f(p|k=220)
Moja reputacja nie wystarcza, aby napisać komentarz pod pytaniem. Zamiast tego napiszę tutaj coś na temat You Can't Bias a Coin . @Adrian
Oto co mamy
Oto nasza hipoteza
Oto nasz wynik
Ponieważ wartość dla testu hipotezy odrzucenia lub wynosi mniej więcej 5%, musimy je zaakceptować. Lub musimy je odrzucić.H 0 H 1p H0 H1
W przeciwnym razie tworzymy tutaj podwójny standard do testowania hipotez. Nie możemy zaakceptować hipotezy, że rzut monetą jest sprawiedliwy, a dane eksperymentu poprawnie zapisane .
Nie ma sensu mówić, że moneta ma prawdopodobieństwo p głów
Mamy wynik eksperymentu na poparcie tej hipotezy.
Jeśli eksperyment powtarza się n razy, to czy możliwe jest, aby przed rzutem monetą uzyskać liczbę jako gdy n jest znacznie duże?N ( μ = 0,5 , σ 2 )p N(μ=0.5,σ2)
Jeśli jest to do przyjęcia, możemy następnie oszacować 95% CI w oparciu o metodę maksymalnego prawdopodobieństwa.σs
źródło