Optymalne losowe oferty

7

To pytanie pochodzi z tej witryny, którą często przeglądam.

Dwóch graczy bierze udział w nowym, gorącym teleturnieju o nazwie „Większa liczba wygrywa”. Oba wchodzą do osobnych kabin i każdy naciska przycisk, a na ekranie pojawia się losowa liczba od zera do jednego. (W tym momencie żaden nie zna numeru drugiej osoby, ale wie, że liczby są wybierane ze standardowego rozkładu równomiernego.) Mogą wybrać, aby zachować ten pierwszy numer, lub ponownie nacisnąć przycisk, aby odrzucić pierwszy numer i uzyskać drugi liczba losowa, którą muszą zachować. Następnie wychodzą ze swoich kabin i widzą ostateczną liczbę każdego gracza na ścianie. Wystawna nagroda główna - skrzynia pełna złota - jest przyznawana graczowi, który zachował wyższą liczbę. Która liczba jest optymalnym punktem odcięcia dla graczy, aby odrzucić swój pierwszy numer i wybrać inny? Innymi słowy, w jakim zakresie powinni zachować pierwszy numer,

Jest to albo bardzo dziwny problem aukcyjny z symetrycznymi graczami (zakładam również, że gracze są neutralni pod względem ryzyka), albo bardzo dziwna loteria / teoria gier.

Jak podchodziłbyś do tego matematycznie pytania i jaką odpowiedź na nie uzyskasz? Nie ma nagroda dla mnie coraz właściwą odpowiedź na zagadkę witryny, jestem po prostu ciekawy. Moja intuicja podpowiada mi, że optymalna wartość odcięcia wynosi 0,5, ponieważ masz 50-50 szans na bycie wyższym lub niższym od liczby przeciwnika, niezależnie od tego, czy on / ona powtórzy ich losową liczbę, czy nie, ale nie jestem pewien.

Kawaleria Kitsune
źródło
Nie sądzę, żeby neutralność ryzyka miała z tym coś wspólnego, gracze po prostu starają się zmaksymalizować prawdopodobieństwo wygranej. Wypłaty są binarne, nie ma bezpiecznych średnich wyników.
Giskard
@denesp Możesz mieć awersję do ryzyka w tym sensie, że jeśli narysujesz powiedzmy 0,46, możesz nie chcieć przerysowywać, nawet jeśli masz większą szansę na uzyskanie lepszej liczby niż gorszej.
Kawaleria Kitsune
1
@KitsuneCavalry Rozumiem, co mówisz, ale byłoby to pewne „behawioralne” pojęcie awersji do ryzyka, ponieważ jest definiowane na etapie przejściowym, a nie końcowym.
Shane
@Shane Pewnie, słyszę cię. I tak nie martwię się o to.
Kawaleria Kitsune

Odpowiedzi:

6

Najpierw pokażę tylko, że 0,5 (lub 12) punkt odcięcia nie działa jako równowaga symetryczna, wówczas możesz sam zdecydować, czy chcesz pomyśleć o problemie, czy przeczytać pełną odpowiedź.

Oznaczmy punkty odcięcia przez cx,cy. Załóżmy, że obaj gracze korzystają ze strategiic=12. Oznaczmy liczby graczyx i y odpowiednio przez x1 i y1 i ich potencjalną drugą liczbę według x2 i y2. Przypuszczaćx1=23. Zachowując to prawdopodobieństwo tego graczax wygrana to

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
To także oznacza, że 23jest medianą tego rozkładu .

Załóżmy teraz x1=12. Zachowując to prawdopodobieństwo tego graczax wygrana to

P(y1<12)P(y2<12)=1212=14
Ale jeśli odrzuci x1=12 ma prawdopodobieństwo
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
wygranej. 38>14 tak zachowując x1=12 (i jego okolice) nie jest optymalny, dlatego nie może być ruchem równowagi.


ALARM SPOILERA

Jeśli gracz y ma odcięcie cy i gracz x rysuje x1=cy i utrzymuje prawdopodobieństwo tego gracza x wygrana to

P(y1<cy)P(y2<cy)=cycy=cy2.
Jeśli gracz x gdzie odrzucić x1 istnieje prawdopodobieństwo, że wygra
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
Załóżmy, że istnieje symetryczna równowaga cx=cy=c.
(Nie sądzę, aby istniały inne równowagi, ale tego nie udowodniłem.)
Ponieważ prawdopodobieństwo wygranej jest stałe w wartościx1, wartość graniczna c jest taki, że jeśli x1=c wtedy prawdopodobieństwo wygranej jest równe, kiedy x1jest przechowywany i kiedy jest odrzucany. To znaczy że
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.

Giskard
źródło
Ktoś zrobił podobne wyprowadzenie jak ty i wykonał to obliczenie Wolframa, aby to dwukrotnie sprawdzić: tinyurl.com/j9xey5t Więc zamierzam powiedzieć, że wygląda to dobrze. Teraz, jeśli rozwiążesz ogólną formę tej gry, dam ci najlepszą odpowiedź: P Żartuję ~ (chociaż byłoby interesujące zobaczyć, jak zmienia się gra z większą szansą na przerzucenie.) Czy edytowany limit oznacza, że ​​obaj gracze mają 50 % wygranej, czy nadal uważasz, że w Twojej odpowiedzi jest błąd?
Kawaleria Kitsune
@KitsuneCavalry Myślę, że zaakceptowanie tego było trochę przedwczesne, ale na szczęście obliczenia są prawidłowe, a moje rozumowanie dotyczące 50% było błędne. Granica jest tak wysoka, że ​​losowanie jest „szczęśliwe” i dlatego masz większą niż 50% szansę na wygraną, jeśli ją wylosujesz. Przed losowaniem masz dokładnie 50%.
Giskard
Jeśli coś się liczy, strona, która udzieliła pytania, udzieliła odpowiedzi. Masz to na pieniądze. Poczuj się jak zwycięzca dzisiaj. Zdobyłeś to B)
Kawaleria Kitsune
2

Załóżmy, że osoba 1 wybiera wartość odcięcia c1 a osoba 2 wybiera granicę c2, z c2c1. Pozwolićp1(x) być prawdopodobieństwem, że ostateczna liczba osoby 1 nie jest większa niż x. p1(x) równa się c1x gdyby x<c1 i c1x+xc1Inaczej. Definiowaćp2(x)podobnie. Teraz działkap2(x) przeciwko p1(x) na wykresie parametrycznym dla 0x1. Wynikiem są trzy segmenty linii:

  • Jeden z (0,0) do (c12,c1c2), odpowiadającej 0xc1;
  • Jeden z (c12,c1c2) do (c1c2+c2c1,c22), odpowiadającej c1xc2;
  • Jeden z (c1c2+c2c1,c22) do (1,1), odpowiadającej c2x1.

Te trzy segmenty linii dzielą kwadrat jednostki na dwie części. Obszar części pod wykresem to prawdopodobieństwo, że osoba 1 ma wyższą liczbę. Niektóre geometrie pokazują, że ten obszar jest12+12(c2c1)(c1c2+c21). Aby istniała stabilna równowaga, obie jej częściowe pochodne muszą wynosić zero, tj

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

Dodanie równań pokazuje to (c2c1)(1+c1+c2)=0, co jest możliwe tylko wtedy, gdy c1=c2. Wracając do jednego z równań,1c1c12=0, więc jedyną stabilną równowagą jest c1=c2=512.

fa''
źródło
To świetna odpowiedź, ale dlaczego nazywacie równowagę stabilną równowagą?
Giskard
1
@denesp Myślę, że to zbędne.
f ''