Zadałem ten problem w MathOverflow , bez zadowalającej odpowiedzi.
Rozważ następującą grę dla dwóch graczy, która jest uproszczeniem gry karcianej o nazwie Zwycięzca . (Poniższe sformułowanie zostało zaczerpnięte z komentarza Guillaume Brunerie na temat MathOverflow.)
Jest dwóch graczy A i B. Każdy gracz ma zestaw kart (podzbiór ), widoczne z obu graczy. Celem gry jest pozbycie się własnych kart. Pierwszy gracz zagrywa dowolną kartę na stole, a następnie drugi gracz musi zagrać (ściśle) większą kartę i tak dalej, dopóki jeden z graczy nie będzie mógł zagrać lub zdecyduje się spasować. Następnie karty na stole są odrzucane, a drugi gracz zaczyna od nowa, zagrywając dowolną kartę (po której nastąpi większa karta). I tak dalej, dopóki jeden z dwóch graczy nie skończy kart i nie wygra gry.
Chcę poznać najlepszą strategię dla graczy (jeśli uda mu się wygrać).
Formalna definicja
Oznacz przez konfiguracja gry, w której znajduje się zestaw kart pierwszego gracza , zestaw kart drugiego gracza to , a największa karta na stole to , gdzie oznacza, że na stole nie ma karty. Chciałbym algorytm obliczyć, podany, czy pierwszy gracz ma zwycięską strategię w konfiguracji .
Formalnie chciałbym, aby algorytm obliczył funkcję zdefiniowane w następujący sposób:
Pozwolić , .
Funkcjonować
gdzie
Złe strategie
Oto kilka niewłaściwych strategii:
- Zawsze graj najmniejszą kartą. Pozwolić, zwycięska strategia dla gracza A w konfiguracji jest grać w karty . Jeśli gracz A zagrywa kartę 1, przegrywa.
- Zagraj najmniejszą kartą, chyba że inny gracz ma tylko jedną kartę. Jest to strategia silniejsza niż strategia 1, ale jest również błędna. Pomyśl tylko o konfiguracji. Jeśli gracz A zastosuje strategię 2, przegra:, więc gracz A przegrywa.
źródło
Odpowiedzi:
To prawdopodobnie powinien być komentarz, ale jest za długi.
Pokrewną grę studiowali Jeff Kahn, Jeff Lagarias i Hans Witsenhausen w serii artykułów Single-Suit Two-Person Card Play I, II, III oraz On Laskar's Card Game. W grze, którą studiowali, każdy gracz man karty, rozdawane z 2n karty ponumerowane 1 … 2n . Każda lewa składa się z dwóch kart, wyższa karta wygrywa lewę, a zwycięzca prowadzi. Celem jest jak najwięcej lew.
Udowodnili szereg interesujących faktów na temat optymalnej strategii, ale nie byli w stanie znaleźć wydajnego algorytmu dla optymalnej gry, a także nie byli w stanie udowodnić, że była trudna do pokonania.
W grze z misère , w której każda osoba próbuje podjąć jak najmniejszą liczbę lew, była w stanie podać optymalną strategię.
W przeważającej części wyniki te uzyskano najpierw patrząc na wyniki programu komputerowego, który znalazł optymalną strategię dla małych instancji, a następnie szukając wzorców do uzyskania domniemań, a na koniec potwierdzając te domysły. Podejrzewam, że byłoby to również owocne podejście do gry PO.
źródło