Problem Monty Hall z omylnym Monty

23

Monty doskonale wiedział, czy za drzwiami stoi koza (czy była pusta). Ten fakt pozwala Graczowi podwoić swój wskaźnik sukcesu w czasie, przełączając „domysły” na inne Drzwi. Co jeśli wiedza Monty'ego nie była doskonała? Co się stanie, jeśli czasami Nagroda rzeczywiście będzie w tej samej Bramie co Kozioł? Ale nie mogłeś tego zobaczyć, dopóki nie wybierzesz i otworzysz SWOJE drzwi? Czy możesz mi pomóc zrozumieć, jak obliczyć JEŻELI - i o ile - Gracz może poprawić swój sukces, gdy celność Monty jest mniejsza niż 100%? Na przykład: co jeśli Monty się myli - średnio 50% czasu? Czy gracz STILL może odnieść korzyść z zamiany zgadywania / drzwi? Wyobrażam sobie, że jeśli Monty ma mniej niż 33,3% szansy na poprawność, że nagroda NIE znajduje się za drzwiami, to najlepszą opcją dla gracza jest NIE zmienianie wyboru drzwi. Czy możesz podać mi sposób, w jaki mogę obliczyć potencjalną korzyść z zamiany, wprowadzając różne prawdopodobieństwa, że ​​Monty ma rację, ponieważ nagroda NIE jest za drzwiami? Nie mam nic poza matematyką w szkole średniej i mam 69 lat, więc proszę, bądź łagodny.


Dzięki za dostarczone informacje i formuły. Wygląda na to, że jeśli „Fallable Monty” ma tylko 66% dokładności w przewidywaniu braku nagrody / samochodu, to ZERO ma korzyść z przejścia z oryginalnego wyboru drzwi ... ponieważ jego 33% poziom błędu jest domyślny stawka podstawowa dla nagrody znajdującej się za DOWOLNYMI drzwiami. Zakłada się jednak, że IF Monty jest lepszy niż 66% w przewidywaniu, gdzie NIE MA NAGRODY, W związku z tym zmiana ma większą użyteczność. Spróbuję zastosować to rozumowanie w grze, w której „ekspert” przewiduje „ekspercką prognozę”, że jedna z trzech mniej więcej równie prawdopodobnych opcji będzie właściwa. Nie wierzę, że ekspert ma rację i jestem całkiem pewien, że jego „wskaźnik trafień” wyniesie mniej niż 33% - więcej niż 15%. Wnioskuję z tego, że gdy „tak samo jak ja, na pewno się mylę i powinienem zmienić się na jedną z dwóch pozostałych! ;-)

Pseudoego
źródło
5
Jeśli dokładność Monty'ego jest mniejsza niż 100%, czy to oznacza, że ​​czasami otwiera drzwi z nagrodą za nimi? Jeśli tak, prawdopodobnie powinieneś wybrać te drzwi.
Faks

Odpowiedzi:

35

Zacznijmy od zwykłego problemu Monty Hall. Troje drzwi, za jednym z nich jest samochód. Pozostali dwaj mają za sobą kozy. Wybierasz drzwi numer 1, a Monty otwiera drzwi numer 2, aby pokazać ci, że za tym stoi koza. Czy powinieneś zmienić zgadywanie na drzwi numer 3? (Pamiętaj, że liczby, których używamy w odniesieniu do każdych drzwi, nie mają tutaj znaczenia. Mogliśmy wybrać dowolne zamówienie, a problem jest taki sam, więc w celu uproszczenia rzeczy możemy po prostu użyć tej numeracji.)

Oczywiście odpowiedź brzmi „tak”, jak już wiesz, ale przejdźmy do obliczeń, aby zobaczyć, jak później się zmienią. Niech do będzie wskaźnikiem drzwi z samochodem, a M. oznacza zdarzenie, w którym Monty ujawnił, że drzwi 2 mają kozę. Musimy obliczyć p(do=3)|M.) . Jeśli ta jest większa niż 1/2) , musimy włączyć nasze przypuszczenie do tych drzwi (ponieważ mamy tylko dwie pozostałe opcje). Prawdopodobieństwo to daje:

p(do=3)|M.)=p(M.|do=3))p(M.|do=1)+p(M.|do=2))+p(M.|do=3))
(Jest to tylko zastosowanie reguły Bayesa z płaską wcześniejszą literą nado)p(M.|do=3))równa się 1: jeśli samochód znajduje się za drzwiami numer 3, to Monty nie miał innego wyjścia, jak otworzyć drzwi numer 2 tak jak on. p(M.|do=1)wynosi1/2) : jeśli samochód znajduje się za drzwiami 1, wtedy Monty miał wybór otwarcia jednego z pozostałych drzwi, 2 lub 3.p(M.|do=2)) wynosi 0, ponieważ Monty nigdy nie otwiera drzwi, o których wie, że ma samochód. Wypełniając te liczby, otrzymujemy:
p(do=3)|M.)=10,5+0+1=2)3)
Z tego znamy wynik.

Rozważmy teraz przypadek, w którym Monty nie ma doskonałej wiedzy o tym, które drzwi mają samochód. Kiedy więc wybierze drzwi (które będziemy dalej nazywać drzwiami nr 2), może przypadkowo wybrać drzwi z samochodem, ponieważ uważa, że ​​ma kozę. Niech do za drzwi, które Monty myśli ma samochód i niech p(do|do) jest prawdopodobieństwo, że on myśli, że samochód jest w pewnym miejscu, uzależnione od jego rzeczywistej lokalizacji. Zakładamy, że jest to opisane przez pojedynczy parametr q który określa jego dokładność, na przykład: p(do=x|do=x)=q=1-p(dox|do=x) . Jeśliq jest równe 1, Monty ma zawsze rację. Jeśliq wynosi 0, Monty zawsze się myli (co nadal ma charakter informacyjny). Jeśliq jest1/3) , informacja Monty ma lepszego niż losowej zgadywanie jest.

Oznacza to, że mamy teraz:

p(M.|do=3))=xp(M.|do=x)p(do=x|do=3))
=p(M.|do=1)p(do=1|do=3))+p(M.|do=2))p(do=2)|do=3))+p(M.|do=3))p(do=3)|do=3))
=12×12(1q)+0×12(1q)+1×q
=14-q4+q=3)4q+14

To znaczy, jeśli samochód był naprawdę za drzwiami 3, istniałyby trzy możliwości, które mogły się rozegrać: (1) Monty myślał, że jest za 1, (2) Monty myślał 2 lub (3) Monty myślał 3. Ostatnia opcja występuje z prawdopodobieństwem q (jak często robi to dobrze), pozostałe dwa dzielą prawdopodobieństwo, że pomyli się (1-q) między nimi. A zatem, biorąc pod uwagę każdy scenariusz, jakie jest prawdopodobieństwo, że zdecydowałby się wskazać drzwi numer 2, tak jak to zrobił? Gdyby myślał, że samochód jest za 1, prawdopodobieństwo to byłoby 1 na 2, ponieważ mógł wybrać 2 lub 3. Gdyby myślał, że jest za 2, nigdy nie wybrałby wskazania na 2. Gdyby myślał, że jest za 3 , zawsze wybrałby 2.

Możemy podobnie obliczyć pozostałe prawdopodobieństwa:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

Wypełniając to wszystko, otrzymujemy:

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
W ramach kontroli poczytalności, gdyq=1, widzimy, że odzyskujemy naszą pierwotną odpowiedź11.5=23 .

Kiedy więc powinniśmy zmienić? Dla uproszczenia założę, że nie wolno nam przejść do drzwi wskazanych przez Monty. I tak długo, jak Monty jest co najmniej w pewnym stopniu poprawny (bardziej niż przypadkowe zgadywanie), drzwi, na które wskazuje, zawsze będą mniej prawdopodobne niż inni, aby mieć samochód, więc nie jest to realna opcja i tak dla nas. Musimy więc wziąć pod uwagę tylko prawdopodobieństwa drzwi 1 i 3. Ale chociaż samochód był za drzwiami 2, to teraz ta opcja ma niezerowe prawdopodobieństwo, więc nie jest już tak, że powinniśmy zmienić gdy p(C=3|M)>0.5 , ale raczej powinniśmy przełączyć, gdy p(C=3|M)>p(C=1|M) (which used to be the same thing). This probability is given by p(C=1|M)=0.51.5=13, same as in the original Monty Hall problem. (This makes sense since Monty can never point towards door 1, regardless of what's behind it, and so he cannot provide information about that door. Rather, when his accuracy drops below 100%, the effect is that some probability "leaks" towards door 2 actually having the car.) So, we need to find q such that p(C=3|M)>13:

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(Which, when q=1, gives an answer of 2, matching the fact that we double our chances of winning by switching doors in the original Monty Hall problem.)

Edit: People were asking about the scenario where we are allowed to switch to the door that Monty points to, which becomes advantageous when q<13, i.e. when Monty is a (somewhat) reliable "liar". In the most extreme scenario, when q=0, this means the door Monty thinks has the car actually for sure has a goat. Note, though, that the remaining two doors could still have either a car or a goat.

The benefit of switching to door 2 is given by:

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
Which is only larger than 1 (and thus worth switching to that door) if 1.5q<0.5, i.e. if q<13, which we already established was the tipping point. Interestingly, the maximum possible benefit for switching to door 2, when q=0, is only 1.5, as compared to a doubling of your winning odds in the original Monty Hall problem (when q=1).

The general solution is given by combining these two switching strategies: when q>13, you always switch to door 3; otherwise, switch to door 2.

Ruben van Bergen
źródło
Wouldn't the expected value actually go back up when q < 1/3, because it isn't modeling how likely he is to be accurate, it is modeling how likely he is to be wrong? As it approached 0 it would mean he is always lying if he can, and your expected winnings would return to 2/3
Cireo
2
@Cireo He wouldn't be lying, he would simply be wrong. Lying would imply him knowing his answer was wrong. I suspect the reason the expected value doesn't go back up is because the chance that he accidentally points to the door with the car behind it (ie, p(M|C=2) is going up) and you can't pick that door, no matter what). q=0 means he always misremembers where the car is, ie there's now a relatively high chance of him pointing to the door with the car behind it.
Buurman
3
A more general solution (which this obviously needs) includes a "hostile" Monty; one who changes what he points at (or even if he points at something) depending on if you picked a goat or a car.
Yakk
3
@Yakk: There are infinitely many more scenarios you can imagine that change the odds in infinitely many ways. It also all depends on if you know how Monty operates. If you know he's hostile, then actually he cannot decrease your odds below 1/3, because you would just decide to ignore whatever he does. If you don't know his decision process, then it totally depends on what you do assume and what he does do exactly, and there are many degrees of freedom there.
Ruben van Bergen
1
@KalevMaricq: Tak naprawdę nie mówiłem o kłamaniu Monty. Problem polega na tym, że samochód może znajdować się za drzwiami, które początkowo wybrałeś, których Monty nie może wybrać (w przeciwnym razie argumentowałbym, że to już nie problem Monty Hall). Może więc mieć tylko dwie koziołki, z których może wybierać, w takim przypadku nie może kłamać, mówiąc, że za jednym z nich jest koza. Nie sądzę więc, aby można było skonstruować prawdziwego „kłamcę Monty” w ramach problemu. Po co poszedłem zamiast (dlaq=0) to Monty, który zawsze myli drzwi z kozą do drzwi samochodu, ale nie wiemy, które drzwi z kozy.
Ruben van Bergen
7

This should be a fairly simple variation of the problem (though I note your limited maths background, so I guess that is relative). I would suggest that you first try to determine the solution conditional on whether Monte is infallible, or fully fallible. The first case is just the ordinary Monte Hall problem, so no work required there. In the second case, you would treat the door he picks as being random over all the doors, including the door with the prize (i.e., he might still pick a door with no prize, but this is now random). If you can calculate the probability of a win in each of these cases then you an use the law of total probability to determine the relevant win probabilities in the case where Monte has some specified level of fallibility (specified by a probability that we is infallible versus fully fallible).

Reinstate Monica
źródło
2
I appreciate the response, but I was looking for something more specific. I'm specifying that Monty has picked a Door. I'm specifying that the probability of the Prize being behind that door could be anywhere from Zero to 100%. I was hoping for a formula which would allow me to simply enter the Probability that Monty is Right/Wrong and then working out the rest of the formula would provide a Numerical Estimate which indicates the Probability that Switching will result in a Win. Is that degree of assistance an unrealistic request?
Pseudoego
4

Opierając się na komentarzach do odpowiedzi Bena, zamierzam zaproponować dwie różne interpretacje tego wariantu Monty Hall, różniące się od Rubena van Bergena.

Pierwszą nazywam Kłamcą Monty, a drugą Niepewną Monty. W obu wersjach problem przebiega następująco:

(0) Są troje drzwi, za którymi jedno jest samochodem, a za pozostałymi dwoma kozami, rozmieszczonymi losowo.

(1) Zawodnik wybiera drzwi losowo.

(2) Monty wybiera drzwi inne niż drzwi zawodnika i twierdzi, że za nimi stoi koza.

(3) Proponuje się, aby uczestnik przeszedł na trzecie niezebrane drzwi, a problem polega na tym: „Kiedy zawodnik powinien się przełączyć, aby zmaksymalizować prawdopodobieństwo znalezienia samochodu za drzwiami?”

W Liar Monty, w kroku (2), jeśli zawodnik wybrał drzwi zawierające kozę, wtedy Monty wybiera drzwi zawierające samochód z pewnym określonym prawdopodobieństwem (tj. Istnieje szansa między 0 a 100%, że będzie kłamał, że koza jest za drzwiami). Zauważ, że w tym wariancie Monty nigdy nie wybiera drzwi zawierających samochód (tzn. Nie może kłamać), jeśli uczestnik wybrał samochód w kroku (1).

W Unreliable Monty istnieje z góry określone prawdopodobieństwo, że drzwi, które Monty wybiera w kroku (2), zawierają samochód. Biorę z twojego komentarza odpowiedź Bena, że ​​jest to scenariusz, który Cię interesuje, i obie moje wersje różnią się od Rubena van Bergena. Zauważ, że niewiarygodny Monty to nie to samo, co Kłamca Monty; rygorystycznie rozróżnimy te dwa przypadki później. Ale rozważ to, w tym scenariuszu drzwi Monty nigdy nie mogą pomieścić samochodu bardziej niż2)3) czasu, ponieważ zawodnik ma prawdopodobieństwo wyboru samochodu 13) czasu.

Aby rozwiązać problem, będziemy musieli użyć kilku równań. Spróbuję sformułować moją odpowiedź, aby była dostępna. Dwie rzeczy, które, mam nadzieję, nie są zbyt mylące, to algebraiczna manipulacja symbolami i warunkowe prawdopodobieństwo. W przypadku tego pierwszego użyjemy symboli w celu oznaczenia:

S.=Samochód znajduje się za drzwiami, na które zawodnik może się przełączyć.S.¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

We use Pr() to denote "the probability of ", so that, put together, something like Pr(M¯) means the probability that the car is not behind the door Monty chose. (I.e. wherever you see an expression involving the symbols, replace the symbols with the "English" equivalents.)

We will also require some rudimentary understanding of conditional probability, which is roughly the probability of something happening if you have knowledge of another related event. This probability will be represented here by expressions such as Pr(S|M¯). The vertical bar | can be thought of as the expression "if you know", so that Pr(S|M¯) can be read as "the probability that the door the contestant can switch to has the car, if you know that the car is not behind Monty's door. In the original Monty Hall problem, Pr(S|M¯)=23, which is larger than Pr(S)=13, which corresponds to the case when Monty has not given you any information.

I will now demonstrate that Unreliable Monty is equivalent to Liar Monty. In Liar Monty, we are given the quantity Pr(M|C¯), the probability that Monty will lie about his door, knowing that the contestant has not chosen the car. In Unreliable Monty, we are given the quantity Pr(M), the probability that Monty lies about his door. Using the definition of conditional probability Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯), and rearranging, we obtain:

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
since Pr(C¯), the probability that the car is not behind the contestant's chosen door is 23 and Pr(C¯|M), the probability that the car is not behind the contestant's chosen door, if we know that it is behind Monty's door, is one.

Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car 23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.

Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculate Pr(S). Using the law of total probability:

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
since Pr(S|C)=Pr(S|C¯ and M)=0 and Pr(S|C¯ and M¯)=1 (convince yourself of this!).

Continuing:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"I added more details in my comment to @alex - Monty is never hostile nor devious, just FALLIBLE, as sometimes he can be wrong for whatever reasons, and never actually opens the door. Research shows that Monty is wrong roughly 33.3% of the time, and the car actually turns out to be there. That is a Posterior Probability of being correct 66.6% of the time, correct? Monty never chooses YOUR door, and you will never choose his. Do these assumptions change anything?"

This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.

Therefore, if Monty's door contains the car 13 of the time, we have the probability of winning when you switch to the last unpicked door as:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)

Alex
źródło
Alex and @Ruben van Bergen et al Thanks for the helpful details. Assume Monty's never hostile, just fallible and tells you "I am pretty sure that the the Car is NOT behind this door." but does not open the door. Let's assume Research shows he is WRONG only about 33.3% of the time, thus correct 66.6% (a Posterior Probability?). There is still some benefit to switching, but once his accuracy reaches only 33.3% then it would make NO sense to switch to either HIS door or the other one. Literally a case of "your guess is as good as mine." Does any of this change your Analyses or Formulae?
Pseudoego
Nie, to nie zmienia mojej analizy. Dodałem coś, co mam nadzieję wyjaśnia pytanie w twoim komentarzu. Przy okazji, nie czytałbym zbyt wiele w słowach „wrogi”, „zawodny”, „kłamstwa monty”. To tak naprawdę nic nie znaczy, chyba że zostanie precyzyjnie zdefiniowane jako (warunkowe) prawdopodobieństwo, że Monty myli się co do drzwi zawierających kozę.
Alex
Bardzo zirytowany faktem, że moja WŁASNA odpowiedź na MOJE WŁASNE pytanie zostanie usunięta, a jedynym wyjaśnieniem jest to, że ta strona nie jest przeznaczona do „dyskusji” - kiedy głównie wyjaśniam, dlaczego uważam, że dotychczasowe Odpowiedzi są prawidłowe, i wyjaśniam, w jaki sposób być użytecznym. W większości innych udzielonych odpowiedzi przeprowadzono znacznie więcej dyskusji. Wydaje mi się to krótkowzroczne - w najlepszym razie - kretyńskie - w najgorszym - usunięcie czyjejś odpowiedzi na własne pytanie: jak możesz wyjaśnić DLACZEGO oceniasz odpowiedź jako NAJLEPSZĄ, nie omawiając jej? Dziękujemy wszystkim, którzy odpowiedzieli niezależnie.
Pseudoego
@Pseudoego your last comment is better post as a comment on your original question. I didn't see your answer, but it sounds like you want to discuss the existing answers, in which case you can modify your original question.
Alex
0

For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.

I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.

Pseudoego
źródło