Czy w celu maksymalizacji szansy na prawidłowe odgadnięcie wyniku rzutu monetą zawsze powinienem wybierać najbardziej prawdopodobny wynik?

20

To nie jest praca domowa. Chciałbym zrozumieć, czy moja logika jest poprawna w przypadku tego prostego problemu dotyczącego statystyk.

Powiedzmy, że mam dwustronną monetę, w której prawdopodobieństwo przewrócenia głowy wynosi a prawdopodobieństwo przewrócenia ogona wynosi . Załóżmy, że wszystkie rzuty mają niezależne prawdopodobieństwo. Teraz powiedzmy, że chcę zmaksymalizować moje szanse na przewidzenie, czy moneta będzie głową czy ogonem podczas następnego rzutu. Jeśli , mogę zgadnąć losowo głowy lub reszki, a prawdopodobieństwo mojej poprawności wynosi .P(H)1P(H)P(H)=0.50.5

Załóżmy teraz, że , jeśli chcę zmaksymalizować moje szanse na prawidłowe odgadnięcie, czy zawsze powinienem zgadywać ogony, w których prawdopodobieństwo wynosi ?P(H)=0.20.8

Idąc o krok dalej, gdybym miał matrycę 3-stronną, a prawdopodobieństwo rzutu 1, 2 lub 3 było , , a , czy powinienem zawsze zgadywać 2, aby zmaksymalizować moje szanse na prawidłowe zgadnięcie? Czy istnieje inne podejście, które pozwoliłoby mi dokładniej zgadywać?P(1)=0.1P(2)=0.5P(3)=0.4

żółw
źródło
4
Wydaje mi się, że pytasz o niezależność: na przykład, jeśli raz zdobędziesz głowy, czy to sprawia, że ​​„ogony” są bardziej prawdopodobne następnym razem? Jeśli nie o to pytasz, czy możesz wyjaśnić swoje pytanie? (Jeśli dobrze zrozumiałem twoje pytanie, odpowiedź brzmi „tak”: w sytuacjach takich jak rzuty monetami najbardziej prawdopodobnym wynikiem zawsze będzie wynik o najwyższym prawdopodobieństwie, niezależnie od tego, co się wcześniej zdarzyło.)
arboviral
Dzięki za pomoc @arboviral. Tak, zakładam niezależność. Zaktualizowałem pytanie, aby to wskazać.
żółw
4
Zakładając niezależność, najlepszą rzeczą, jaką możesz zrobić, to wybrać stronę o najwyższym prawdopodobieństwie. Pomyśl o tym w ten sposób. Nie masz innych informacji, aby lepiej zgadnąć. Wszystko, co wiesz o kościach, to to, jak często pojawia się jakaś strona i jakie były ostatnie rzuty. Ale niezależność mówi ci, że poprzednie rzędy nie mają wpływu na aktualny rzut. Może gdybyś miał więcej informacji, takich jak ilość siły użytej do rzutu kostką, miotacz lewej / prawej ręki lub liczba wstrząsów przed rzutem. Jeśli jednak kości są naprawdę uczciwe, wątpię, aby nawet ten poziom szczegółowości zapewniał lepsze prognozy.
Brent Ferrier
Twoje domysły są poprawne; jest to bezpośrednia konsekwencja Nierówności Posiadacza (z parametrami ). (1,)
whuber
Czy wiesz, że P (H) = 0,2? Czy jest to coś, co musisz zrozumieć, obserwując wyniki?
Akavall

Odpowiedzi:

43

Masz rację. Jeśli , a używasz straty zero-jedynkowej (to znaczy, musisz odgadnąć rzeczywisty wynik w przeciwieństwie do prawdopodobieństwa lub czegoś takiego, a ponadto zdobywanie głów, gdy odgadniesz, że ogony są równie złe jak dostając ogony, gdy odgadniesz głowy), powinieneś zgadywać ogony za każdym razem.P(H)=0.2

Ludzie często mylnie myślą, że odpowiedzią jest odgadnięcie ogonów na losowo wybranych 80% prób, a na pozostałych - głów. Strategia ta nazywa się „ dopasowywaniem prawdopodobieństwa ” i została szeroko zbadana w podejmowaniu decyzji behawioralnych. Zobacz na przykład

West, RF i Stanovich, KE (2003). Czy prawdopodobieństwo dopasowania jest inteligentne? Powiązania między wyborami probabilistycznymi a zdolnościami poznawczymi. Pamięć i poznanie, 31 , 243–251. doi: 10.3758 / BF03194383

Kodiolog
źródło
1
+1 dla wskaźnika do dopasowania prawdopodobieństwa. Nigdy wcześniej o tym nie słyszałem, ale jestem pewien, że codziennie wykorzystuję to jako nastawienie poznawcze! :)
leekaiinthesky
2
(+1) Odnosi się to do powszechnego nieporozumienia w interpretacji modeli regresji wielomianowej i tym podobnych: ludzie mogą być zaskoczeni, że rozkład przewidywanych klas nie zgadza się z rozkładem obserwowanych klas, a nawet zastanawiać się nad sposobami „naprawienia” tego . (Miło wiedzieć, że ma nazwę.)
Scortchi - Przywróć Monikę
1
(+1) dla terminu „dopasowanie prawdopodobieństwa”.
Haitao Du
13

Zasadniczo zadajesz bardzo interesujące pytanie: czy powinienem przewidzieć użycie „MAP Bayesian” Maximum a posteriori estymacji lub „Real Bayesian”.

Załóżmy, że znasz prawdziwy rozkład, że , a następnie używając oszacowania MAP, załóżmy, że chcesz zrobić 100 prognoz na następne 100 wyników przerzucania. Zawsze powinieneś zgadywać, że klapka jest ogonem , a NIE zgadywaniem 20 głów i 80 ogonów. Nazywa się to „MAP Bayesian”, w zasadzie robiszP(H)=0.22080

argmaxθf(x|θ)

Nie jest trudno udowodnić, że dzięki temu można zminimalizować przewidywany błąd (utrata 0-1). Dowód można znaleźć na ~ stronie 53 Wstępu do nauki statystycznej .


Istnieje inny sposób na to, zwany „prawdziwym bayesowskim” podejściem. Zasadniczo nie próbujesz „wybrać wyniku z najwyższym prawdopodobieństwem, ale rozważ wszystkie przypadki probablistycznie”. Jeśli więc ktoś poprosi cię o „przewidywanie kolejnych 100” rzutów, powinieneś go zatrzymać, ponieważ kiedy podałeś 100 wyników binarnych, informacja probabilistyczna dla każdego wyniku znika. Zamiast tego powinieneś zapytać, co chcesz zrobić PO znajomości wyników.

Załóżmy, że on / ona ma jakąś funkcję utraty (na przykład straty 0-1, funkcja utraty może być taka, że ​​jeśli stracisz głowę, musisz zapłacić 1 $ , ale jeśli przegapisz ogon, musisz zapłacić 5 USD , tj. Niezbilansowana strata) w swojej prognozie, powinieneś wykorzystać swoją wiedzę o rozkładzie wyników, aby zminimalizować straty w całym rozkładzie

xyp(x,y)L(f(x),y)

, tj. wykorzystaj swoją wiedzę na temat podziału na straty, zamiast „zorientowanego etapowo”, uzyskiwania prognoz i robienia kolejnych kroków.

P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%

Haitao Du
źródło
4
MAP jest również bayesowski. Ponadto można opisać oba podejścia nie odwołując się zresztą do korzystania prawdopodobieństwa a priori, co może być mylące, ponieważ piszesz o metodach Bayesa i priors są istotę tych metod.
Tim
„Tak więc, jeśli ktoś poprosi cię o„ przewidywanie następnych 100 ”przewrotów, nie powinieneś tego robić”. Gdyby ktoś zaproponował mi miliard euro, jeśli dobrze przewiduję, prawdopodobnie nie odmówiłbym. Lub prawdopodobnie masz na myśli „przewidywanie” w innym znaczeniu niż „próbować zgadywać”.
JiK
„kiedy podałeś 100 wyników binarnych, informacje probabilistyczne dla każdego wyniku znikają” Na początku czytam to jako „kiedy otrzymujesz 100 wyników binarnych” i nie rozumiem zdania, ale teraz zdałem sobie sprawę, że to może oznaczać „kiedy podasz 100 wyników binarnych ”. Który z nich jest poprawny, a jeśli pierwszy, co to oznacza?
JiK
1
Bardzo drobna uwaga: prawdopodobnie dodam pionową linię po drugim akapicie, aby wskazać, że dwa pierwsze akapity są wystarczające technicznie, aby odpowiedzieć na dosłowne pytanie, a reszta to nieco dodatkowa informacja (co jest niewątpliwie interesujące i przydatne).
JiK
2
W ostatnim akapicie: „Szacowanie MAP nie będzie działać dobrze, jeśli liczba wyników będzie duża. - - Jednak 90% razy się pomylisz !!” Nie działa dobrze jest zawsze kwestią kontekstu. Jeśli jest to na przykład gra z powtarzaniem zakładów (pula jest dzielona między osoby, które zgadują poprawnie lub wróci, jeśli nikt nie zgadnie), strategia MAP na dłuższą metę z pewnością wygra dużo pieniędzy, jeśli grasz przeciwko ludziom, którzy np. Losują swoje domysły z dystrybucji wyników.
JiK
4

Ze względu na niezależność wartość oczekiwań jest zawsze maksymalizowana, jeśli odgadniesz najbardziej prawdopodobny przypadek. Nie ma lepszej strategii, ponieważ każdy rzut / rzut nie daje żadnych dodatkowych informacji na temat monety / kości.

Gdziekolwiek odgadniesz mniej prawdopodobny wynik, twoje oczekiwania na wygraną są mniejsze niż w przypadku odgadnięcia najbardziej prawdopodobnego przypadku, dlatego lepiej zgadnąć najbardziej prawdopodobny przypadek.

Jeśli chciałeś to zrobić, abyś musiał zmienić strategię podczas odwracania, możesz rozważyć monetę / kość, w której początkowo nie znasz szans i musisz je rozpracować podczas rzutu.

Kitter Catter
źródło
1
dla mnie ta odpowiedź jest najprostszym wyjaśnieniem; gdybyś musiał zdefiniować strategię, biorąc pod uwagę wcześniej osiągnięty wynik, przełamałbyś „niezależne” prawdopodobieństwa.
Walfrat