Paradoks więźnia

11

Dostaję ćwiczenie i nie potrafię tego rozgryźć.

Paradoks więźnia

Trzej więźniowie w izolatkach A, B i C zostali skazani na śmierć tego samego dnia, ale ponieważ jest święto narodowe, gubernator decyduje o ułaskawieniu. Więźniowie są o tym informowani, ale informowani, że nie będą wiedzieli, który z nich zostanie oszczędzony, do dnia wyznaczonego na egzekucje.

Więzień A mówi do strażnika: „Wiem już, że co najmniej jeden z pozostałych dwóch więźniów zostanie stracony, więc jeśli powiesz mi nazwisko tego, który zostanie stracony, nie podasz mi żadnych informacji o mojej własnej egzekucji” .

Strażnik akceptuje to i mówi mu, że C na pewno umrze.

Powody, dla których „Zanim wiedziałem, że C ma zostać stracony, miałem 1 na 3 szansę na ułaskawienie. Teraz wiem, że albo B, albo ja zostaną ułaskawieni, szanse wzrosły do ​​1 na 2 ”.

Ale strażnik zwrócił uwagę na „Mógłbyś dojść do podobnego wniosku, gdybym powiedział, że B umrze, a ja musiałbym odpowiedzieć albo B, albo C, więc dlaczego musiałeś pytać?”.

Jakie są szanse A na ułaskawienie i dlaczego? Zbuduj wyjaśnienie, które przekona innych, że masz rację.

Możesz rozwiązać ten problem twierdzeniem Bayesa, rysując sieć przekonań lub kierując się zdrowym rozsądkiem. Którekolwiek podejście wybierzesz, powinno pogłębić twoje zrozumienie zwodniczo prostej koncepcji warunkowego prawdopodobieństwa.

Oto moja analiza:

Wygląda to na problem Monty Hall , ale nie do końca. Jeśli A powie I change my place with Bpo powiedzeniu, że C umrze, ma 2/3 szans na uratowanie. Jeśli tego nie zrobi, powiedziałbym, że jego szanse na przeżycie to 1/3, na przykład wtedy, gdy nie zmienisz wyboru w problemie Monty Hall. Ale jednocześnie jest w grupie 2 facetów i należy umrzeć, więc kuszące jest stwierdzenie, że jego szanse to 1/2.

Paradoks wciąż istnieje, jak byś do tego podszedł. Poza tym nie mam pojęcia, jak mógłbym stworzyć sieć przekonań na ten temat, więc jestem zainteresowany tym.

Benjamin Crouzier
źródło
2
„Jest w grupie 2 facetów” nie oznacza, że ​​„jego szanse to 1/2”
Henry

Odpowiedzi:

8

Początkowo istnieją trzy możliwości z jednakowymi prawdopodobieństwami:

  • A zostanie uwolniony (prob )1/3
  • B zostanie uwolniony (prob )1/3
  • C zostanie uwolniony (prob )1/3

Dzięki obietnicy przesłania istnieją cztery możliwości z różnymi prawdopodobieństwami:

  • A zostanie zwolnione, a A powie się, że B zostanie wykonane (prob )1/6
  • A zostanie zwolnione, a A powie się, że C zostanie wykonane (prob )1/6
  • B zostanie uwolniony, a A powie się, że C zostanie wykonany (prob )1/3
  • C zostanie zwolniony, a A powie się, że B zostanie wykonany (prob )1/3

Jest to uzależnione od „powiedziane A zostanie wykonane C”

  • A zostanie zwolnione, a A powie się, że C zostanie wykonany (prob )1/3
  • B zostanie uwolniony, a A powie się, że C zostanie wykonany (prob )2/3

Więc po komunikacie A chciałby zamienić się na B (problem Monty Hall), ale nie może i dlatego zachowuje oryginalne prawdopodobieństwo wykonania.2/3

Henz
źródło
1
Kluczem jest chęć zamiany z B. Aby wziąć jedno z typowych wyjaśnień Monty Hall: Wyobraź sobie, że jest 1000 więźniów: A pyta strażnika, który nadaje mu 998 nazwisk. Najwyraźniej właśnie dowiedzieliśmy się wiele o tym facecie, który nie jest A i nie ma imienia . Ale nie wie nic na temat uczyć A .
Ben Jackson
Myślę, że w pozycji A jest to bardzo dobra strategia, aby zapytać o to strażnika. Potem porozmawiaj z B i zapytaj, czy chce się zmienić. Jeśli się zgodzi, możecie zapytać katów, czy jeśli któryś z nich ma zostać uwolniony, uwolnij drugiego. Z punktu widzenia B jego szanse się nie zmieniają, więc nie ma powodu, aby powiedział „nie” (lub „tak”, więc w tym momencie jest to kwestia presji)
Cruncher
8

Myślę, że przesadnie zastanawiasz się nad problemem - jest to problem Monty Halla i obowiązuje ta sama logika.

czytnik babelproofreader
źródło
Czy potrafisz się rozwinąć? Interesuje mnie rozumowanie, a nie odpowiedź
Benjamin Crouzier,
1
@pinouchon: Jailer to Monty Hall, a więzień A to gracz. Dieta jest analogiczna do uzyskania kozy; ułaskawienie jest analogiczne do otrzymania nagrody. Teraz możesz bezpośrednio przetłumaczyć dowolne wyjaśnienie problemu Monty Hall, które ci się podoba: obejmuje ono wiele argumentów. +1 do czytnika babelproofreadera za wskazanie tego.
whuber
W jaki sposób można argumentować przeciwko tym stwierdzeniem But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. A co z siecią przekonań?
Benjamin Crouzier,
1
@ Pinouchon Byłoby konstruktywne, aby edytować swoje pytanie, aby skupić się na aspekcie sieci przekonań. Sam problem Monty Hall był omawiany na śmierć w wielu, wielu miejscach, więc nie widzę sensu w tym, żeby przerabiać ten materiał tutaj.
whuber
Zgadzam się, że problem Monty Hall był omawiany na śmierć, ale pomimo twierdzeń babelproof i whubera, nie wiem, gdzie więzień A może zamienić się miejscami. Jeśli strażnik miał trzy zapieczętowane koperty, jedną zawierającą ułaskawienie i dwie zawierające wyroki śmierci, A wybrał jedną kopertę, a strażnik otworzył kolejną (dokładnie takie same zasady, jak podałem w osobnej odpowiedzi) i wykazał, że zawiera wyrok śmierci, oraz następnie zapytał: „Czy chcesz zachować wybraną kopertę, czy wolisz zmienić?” Widzę analogię
Dilip Sarwate,
3

AP(A)=13B

  • P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

B

13 bez względu na to, czy Monty otworzy niezbrane drzwi, aby odsłonić kozę, czy też więzień mówi A, że C zostanie stracony, czy nie, dokładnie tak, jak Henry obliczył szczegółowo.

Dilip Sarwate
źródło
Myślę, że możemy założyć, że strażnik ma takie informacje, w przeciwnym razie problem nie jest wart uzasadnienia (jeśli strażnik ma nieznane prawdopodobieństwo kłamstwa, równie dobrze mogliby nic nie powiedzieć). Jeśli chodzi o twój pierwszy punkt: jasne, wynik jest inny niż w przypadku Monty Hall, ponieważ nie ma opcji przełączenia. Ale logika jest taka sama: ujawniając jedną opcję, która nie jest zwycięzcą, podaje się informacje o innej opcji, którą więzień / Monty mógł wybrać.
Ruben van Bergen
2

Odpowiedź zależy od tego, w jaki sposób strażnik wybiera, którego więźnia ma nazwać, gdy wie, że A ma zostać ułaskawiony. Rozważ dwie zasady:

1) Strażnik wybiera losowo B i C, aw tym przypadku akurat powiedział C. Wtedy szansa na ułaskawienie A wynosi 1/3.

2) Strażnik zawsze mówi C. Wtedy szansa A na ułaskawienie wynosi 1/2.

Mówi się nam tylko, że strażnik powiedział C, więc nie wiemy, którą z tych zasad przestrzegał. W rzeczywistości mogą istnieć inne zasady - być może strażnik rzuca kostką i mówi C tylko, jeśli rzuci 6.

Ringold
źródło
0

Wyobraź sobie, że strażnik mówi A, że C na pewno umrze. A potem mówi B, że C na pewno umrze. W tym przypadku jasne jest, że A i B mają po 50% do przebaczenia. Ale jaka jest różnica między dwiema wersjami?

gach
źródło
0

1/22/3

ABCJJc

P(A|J)=P(J|A)P(A)/P(J)

  1. P(J|A)=12

P(A|J)=12×13/12=13
  1. P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12
Michaił Wołchow
źródło
1
Czy „nie zawsze nazywaj Carl, gdy to możliwe” byłoby tak wiarygodne, jak „zawsze nazywaj Boba, gdy to możliwe”?
Juho Kokkala,
Tak, strategia S '= „zawsze nazywaj Carl, jeśli to możliwe” musi być całkowicie równoważna, jeśli odpowiednio zdefiniujemy J. Jeśli zostawimy J takim, jakim jest, i zmusimy strażnika do podążania za S ', wszystko sprawi, że wszystko będzie z góry ustalone: ​​ilekroć J (strażnik mówi Bob), wiemy, że nie można powiedzieć „Carl”, więc Carl został ułaskawiony .
Michaił Wołchow
-1

Po otrzymaniu informacji, że Więzień C umrze, jego szanse zmieniają się na 1/2, ale tylko dlatego, że szanse, że dostanie tę informację, wynoszą już 2/3 (1/3 możliwości uzyskania ułaskawienia przez więźnia C jest wyeliminowana )

A 2/3 * 1/2 to pierwotne prawdopodobieństwo uwolnienia.

Bardziej przekonujące jest podejście opozycyjne:

Załóżmy, że powiedziano mu, że więzień C otrzyma ułaskawienie.
Jakie są jego szanse na to, że nie zostanie zabity?
Wszyscy uznają, że jego szanse są zerowe, zakładając, że strażnik nie kłamie i jest tylko jedno ułaskawienie.

Tym razem ma szansę 1/1, ponieważ szansa na uzyskanie tych informacji wynosiła już 1/3.

Sunzi
źródło
To nie jest poprawne; zobacz kalkulację w odpowiedzi Henry'ego, która pokazuje, że po wysłuchaniu informacji strażnika więzień A ma 2/3 szansy na śmierć (nie 1/2). Jest to takie samo prawdopodobieństwo, jakie miał wcześniej, więc strażnik ma rację: to, co powiedział A, nic nie zmieniło, jeśli chodzi o szanse życia A. Gdyby jednak B nasłuchiwał, wiedziałby, że jego szansa na śmierć została zmniejszona do 1/3.
Ruben van Bergen