Monty doskonale wiedział, czy za drzwiami stoi koza (czy była pusta). Ten fakt pozwala Graczowi podwoić swój wskaźnik sukcesu w czasie, przełączając „domysły” na inne Drzwi. Co jeśli wiedza Monty'ego nie była doskonała? Co się stanie, jeśli czasami Nagroda rzeczywiście będzie w tej samej Bramie co Kozioł? Ale nie mogłeś tego zobaczyć, dopóki nie wybierzesz i otworzysz SWOJE drzwi? Czy możesz mi pomóc zrozumieć, jak obliczyć JEŻELI - i o ile - Gracz może poprawić swój sukces, gdy celność Monty jest mniejsza niż 100%? Na przykład: co jeśli Monty się myli - średnio 50% czasu? Czy gracz STILL może odnieść korzyść z zamiany zgadywania / drzwi? Wyobrażam sobie, że jeśli Monty ma mniej niż 33,3% szansy na poprawność, że nagroda NIE znajduje się za drzwiami, to najlepszą opcją dla gracza jest NIE zmienianie wyboru drzwi. Czy możesz podać mi sposób, w jaki mogę obliczyć potencjalną korzyść z zamiany, wprowadzając różne prawdopodobieństwa, że Monty ma rację, ponieważ nagroda NIE jest za drzwiami? Nie mam nic poza matematyką w szkole średniej i mam 69 lat, więc proszę, bądź łagodny.
Dzięki za dostarczone informacje i formuły. Wygląda na to, że jeśli „Fallable Monty” ma tylko 66% dokładności w przewidywaniu braku nagrody / samochodu, to ZERO ma korzyść z przejścia z oryginalnego wyboru drzwi ... ponieważ jego 33% poziom błędu jest domyślny stawka podstawowa dla nagrody znajdującej się za DOWOLNYMI drzwiami. Zakłada się jednak, że IF Monty jest lepszy niż 66% w przewidywaniu, gdzie NIE MA NAGRODY, W związku z tym zmiana ma większą użyteczność. Spróbuję zastosować to rozumowanie w grze, w której „ekspert” przewiduje „ekspercką prognozę”, że jedna z trzech mniej więcej równie prawdopodobnych opcji będzie właściwa. Nie wierzę, że ekspert ma rację i jestem całkiem pewien, że jego „wskaźnik trafień” wyniesie mniej niż 33% - więcej niż 15%. Wnioskuję z tego, że gdy „tak samo jak ja, na pewno się mylę i powinienem zmienić się na jedną z dwóch pozostałych! ;-)
źródło
Odpowiedzi:
Zacznijmy od zwykłego problemu Monty Hall. Troje drzwi, za jednym z nich jest samochód. Pozostali dwaj mają za sobą kozy. Wybierasz drzwi numer 1, a Monty otwiera drzwi numer 2, aby pokazać ci, że za tym stoi koza. Czy powinieneś zmienić zgadywanie na drzwi numer 3? (Pamiętaj, że liczby, których używamy w odniesieniu do każdych drzwi, nie mają tutaj znaczenia. Mogliśmy wybrać dowolne zamówienie, a problem jest taki sam, więc w celu uproszczenia rzeczy możemy po prostu użyć tej numeracji.)
Oczywiście odpowiedź brzmi „tak”, jak już wiesz, ale przejdźmy do obliczeń, aby zobaczyć, jak później się zmienią. Niechdo będzie wskaźnikiem drzwi z samochodem, a M. oznacza zdarzenie, w którym Monty ujawnił, że drzwi 2 mają kozę. Musimy obliczyć p ( C= 3 | M.) . Jeśli ta jest większa niż 1 / 2 , musimy włączyć nasze przypuszczenie do tych drzwi (ponieważ mamy tylko dwie pozostałe opcje). Prawdopodobieństwo to daje:
p ( C= 3 | M.) = p ( M| do= 3 )p ( M| do= 1 ) + p ( M| do= 2 ) + p ( M| do= 3 )
(Jest to tylko zastosowanie reguły Bayesa z płaską wcześniejszą literą nado )p ( M| do= 3 ) równa się 1: jeśli samochód znajduje się za drzwiami numer 3, to Monty nie miał innego wyjścia, jak otworzyć drzwi numer 2 tak jak on. p ( M| do= 1 ) wynosi1 / 2 : jeśli samochód znajduje się za drzwiami 1, wtedy Monty miał wybór otwarcia jednego z pozostałych drzwi, 2 lub 3.p ( M| do= 2 ) wynosi 0, ponieważ Monty nigdy nie otwiera drzwi, o których wie, że ma samochód. Wypełniając te liczby, otrzymujemy:
p ( C= 3 | M.) = 10,5 + 0 + 1= 23)
Z tego znamy wynik.
Rozważmy teraz przypadek, w którym Monty nie ma doskonałej wiedzy o tym, które drzwi mają samochód. Kiedy więc wybierze drzwi (które będziemy dalej nazywać drzwiami nr 2), może przypadkowo wybrać drzwi z samochodem, ponieważ uważa, że ma kozę. Niechdo′ za drzwi, które Monty myśli ma samochód i niech p ( C′| do) jest prawdopodobieństwo, że on myśli, że samochód jest w pewnym miejscu, uzależnione od jego rzeczywistej lokalizacji. Zakładamy, że jest to opisane przez pojedynczy parametr q który określa jego dokładność, na przykład: p ( C′= x | do= x ) = q= 1 - p ( C′≠ x | do= x ) . Jeśliq jest równe 1, Monty ma zawsze rację. Jeśliq wynosi 0, Monty zawsze się myli (co nadal ma charakter informacyjny). Jeśliq jest1 / 3 , informacja Monty ma lepszego niż losowej zgadywanie jest.
Oznacza to, że mamy teraz:p ( M| do= 3 ) = ∑xp ( M| do′= x ) p ( C′= x | do= 3 )
= p ( M| do′= 1 ) p ( C′= 1 | do= 3 ) + p ( M| do′= 2 ) p ( C′= 2 | do= 3 )+ p ( M| do′= 3 ) p ( C′= 3 | do= 3 )
= 12)× 12)(1−q)+0×12(1−q)+1×q
= 14- q4+ q= 34q+ 14
To znaczy, jeśli samochód był naprawdę za drzwiami 3, istniałyby trzy możliwości, które mogły się rozegrać: (1) Monty myślał, że jest za 1, (2) Monty myślał 2 lub (3) Monty myślał 3. Ostatnia opcja występuje z prawdopodobieństwemq (jak często robi to dobrze), pozostałe dwa dzielą prawdopodobieństwo, że pomyli się ( 1 - q) między nimi. A zatem, biorąc pod uwagę każdy scenariusz, jakie jest prawdopodobieństwo, że zdecydowałby się wskazać drzwi numer 2, tak jak to zrobił? Gdyby myślał, że samochód jest za 1, prawdopodobieństwo to byłoby 1 na 2, ponieważ mógł wybrać 2 lub 3. Gdyby myślał, że jest za 2, nigdy nie wybrałby wskazania na 2. Gdyby myślał, że jest za 3 , zawsze wybrałby 2.
Możemy podobnie obliczyć pozostałe prawdopodobieństwa:p ( M| do= 1 ) = ∑xp ( M| do′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12−q2=12
Wypełniając to wszystko, otrzymujemy:p(C=3|M)=34q+1412+34−34q+34q+14
=0.75q+0.251.5
W ramach kontroli poczytalności, gdyq=1 , widzimy, że odzyskujemy naszą pierwotną odpowiedź11.5=23 .
Kiedy więc powinniśmy zmienić? Dla uproszczenia założę, że nie wolno nam przejść do drzwi wskazanych przez Monty. I tak długo, jak Monty jest co najmniej w pewnym stopniu poprawny (bardziej niż przypadkowe zgadywanie), drzwi, na które wskazuje, zawsze będą mniej prawdopodobne niż inni, aby mieć samochód, więc nie jest to realna opcja i tak dla nas. Musimy więc wziąć pod uwagę tylko prawdopodobieństwa drzwi 1 i 3. Ale chociaż samochód był za drzwiami 2, to teraz ta opcja ma niezerowe prawdopodobieństwo, więc nie jest już tak, że powinniśmy zmienić gdyp(C=3|M)>0.5 , ale raczej powinniśmy przełączyć, gdy p(C=3|M)>p(C=1|M) (which used to be the same thing). This probability is given by p(C=1|M)=0.51.5=13 , same as in the original Monty Hall problem. (This makes sense since Monty can never point towards door 1, regardless of what's behind it, and so he cannot provide information about that door. Rather, when his accuracy drops below 100%, the effect is that some probability "leaks" towards door 2 actually having the car.) So, we need to find q such that p(C=3|M)>13 :
0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13 p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(Which, when q=1 , gives an answer of 2, matching the fact that we double our chances of winning by switching doors in the original Monty Hall problem.)
Edit: People were asking about the scenario where we are allowed to switch to the door that Monty points to, which becomes advantageous whenq<13 , i.e. when Monty is a (somewhat) reliable "liar". In the most extreme scenario, when q=0 , this means the door Monty thinks has the car actually for sure has a goat. Note, though, that the remaining two doors could still have either a car or a goat.
The benefit of switching to door 2 is given by:p(C=2|M)p(C=1|M)=0.75−0.75q1.513=1.5−1.5q
Which is only larger than 1 (and thus worth switching to that door) if 1.5q<0.5 , i.e. if q<13 , which we already established was the tipping point. Interestingly, the maximum possible benefit for switching to door 2, when q=0 , is only 1.5, as compared to a doubling of your winning odds in the original Monty Hall problem (when q=1 ).
The general solution is given by combining these two switching strategies: whenq>13 , you always switch to door 3; otherwise, switch to door 2.
źródło
q < 1/3
, because it isn't modeling how likely he is to be accurate, it is modeling how likely he is to be wrong? As it approached 0 it would mean he is always lying if he can, and your expected winnings would return to 2/3This should be a fairly simple variation of the problem (though I note your limited maths background, so I guess that is relative). I would suggest that you first try to determine the solution conditional on whether Monte is infallible, or fully fallible. The first case is just the ordinary Monte Hall problem, so no work required there. In the second case, you would treat the door he picks as being random over all the doors, including the door with the prize (i.e., he might still pick a door with no prize, but this is now random). If you can calculate the probability of a win in each of these cases then you an use the law of total probability to determine the relevant win probabilities in the case where Monte has some specified level of fallibility (specified by a probability that we is infallible versus fully fallible).
źródło
Opierając się na komentarzach do odpowiedzi Bena, zamierzam zaproponować dwie różne interpretacje tego wariantu Monty Hall, różniące się od Rubena van Bergena.
Pierwszą nazywam Kłamcą Monty, a drugą Niepewną Monty. W obu wersjach problem przebiega następująco:
(0) Są troje drzwi, za którymi jedno jest samochodem, a za pozostałymi dwoma kozami, rozmieszczonymi losowo.
(1) Zawodnik wybiera drzwi losowo.
(2) Monty wybiera drzwi inne niż drzwi zawodnika i twierdzi, że za nimi stoi koza.
(3) Proponuje się, aby uczestnik przeszedł na trzecie niezebrane drzwi, a problem polega na tym: „Kiedy zawodnik powinien się przełączyć, aby zmaksymalizować prawdopodobieństwo znalezienia samochodu za drzwiami?”
W Liar Monty, w kroku (2), jeśli zawodnik wybrał drzwi zawierające kozę, wtedy Monty wybiera drzwi zawierające samochód z pewnym określonym prawdopodobieństwem (tj. Istnieje szansa między 0 a 100%, że będzie kłamał, że koza jest za drzwiami). Zauważ, że w tym wariancie Monty nigdy nie wybiera drzwi zawierających samochód (tzn. Nie może kłamać), jeśli uczestnik wybrał samochód w kroku (1).
W Unreliable Monty istnieje z góry określone prawdopodobieństwo, że drzwi, które Monty wybiera w kroku (2), zawierają samochód. Biorę z twojego komentarza odpowiedź Bena, że jest to scenariusz, który Cię interesuje, i obie moje wersje różnią się od Rubena van Bergena. Zauważ, że niewiarygodny Monty to nie to samo, co Kłamca Monty; rygorystycznie rozróżnimy te dwa przypadki później. Ale rozważ to, w tym scenariuszu drzwi Monty nigdy nie mogą pomieścić samochodu bardziej niż2)3) czasu, ponieważ zawodnik ma prawdopodobieństwo wyboru samochodu 13) czasu.
Aby rozwiązać problem, będziemy musieli użyć kilku równań. Spróbuję sformułować moją odpowiedź, aby była dostępna. Dwie rzeczy, które, mam nadzieję, nie są zbyt mylące, to algebraiczna manipulacja symbolami i warunkowe prawdopodobieństwo. W przypadku tego pierwszego użyjemy symboli w celu oznaczenia:
We usePr(∗) to denote "the probability of ∗ ", so that, put together, something like Pr(M¯) means the probability that the car is not behind the door Monty chose. (I.e. wherever you see an expression involving the symbols, replace the symbols with the "English" equivalents.)
We will also require some rudimentary understanding of conditional probability, which is roughly the probability of something happening if you have knowledge of another related event. This probability will be represented here by expressions such asPr(S|M¯) . The vertical bar | can be thought of as the expression "if you know", so that Pr(S|M¯) can be read as "the probability that the door the contestant can switch to has the car, if you know that the car is not behind Monty's door. In the original Monty Hall problem, Pr(S|M¯)=23 , which is larger than Pr(S)=13 , which corresponds to the case when Monty has not given you any information.
I will now demonstrate that Unreliable Monty is equivalent to Liar Monty. In Liar Monty, we are given the quantityPr(M|C¯) , the probability that Monty will lie about his door, knowing that the contestant has not chosen the car. In Unreliable Monty, we are given the quantity Pr(M) , the probability that Monty lies about his door. Using the definition of conditional probability Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯) , and rearranging, we obtain:
Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.
Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculatePr(S) . Using the law of total probability:
Continuing:
So you see, when Monty always lies (akaPr(M|C¯))=1 ) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S) , is 23 .
From this you can work out the optimal strategies for both Liar, and Unreliable Monty.
Addendum 1
In response to comment (emphasis mine):
This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.
Therefore, if Monty's door contains the car13 of the time, we have the probability of winning when you switch to the last unpicked door as:
Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)
źródło
For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.
I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.
źródło