Rozważmy jednoczesną grę dla dwóch graczy, w której każdy gracz wybiera wartość nieujemną, $ x_i $, $ i = 1,2 $. Wypłata dla każdego gracza wynosi $ π_i (x_1, x_2) = 2x_i + 2x_1x_2-x_i ^ 2. $
za. Jakie są czyste strategie równowagi Nasha w tej grze?
b. Załóżmy, że zestaw strategii jest ograniczony do $ [0, M], M> 0 $. Jakie są teraz czyste strategie równowagi Nasha w grze?
A) Dostałem odpowiedź, że nie ma PSNE, ponieważ nie ma przecięcia między najlepszą funkcją odpowiedzi obu graczy. Popraw mnie, jeśli to źle!
Dla b) zrobiłem się bardzo zdezorientowany, ponieważ nie jestem pewien, w jaki sposób ograniczenie wartości $ x $ spowoduje, że wniosek będzie się różnił od a). Zdaję sobie sprawę, że podana funkcja wypłaty niekoniecznie oznacza, że im większy jest $ x_i $, tym większa będzie wypłata.
Poniżej jest mój dowód:
Rozważ $ π_i (x_1, x_2) = 2x_i + 2x_1x_2-x_i ^ 2. $. Najpierw zakładamy, że $ x_1 & gt; x_2 $. Aby dowiedzieć się, czy większa liczba prowadzi do wyższej wypłaty, tj.
jeśli $ 2x_1 + 2x_1x_2-x_1 ^ 2 & gt; 2x_2 + 2x_1x_2-x_2 ^ 2 $
$ 2x_1-x_1 ^ 2 & gt; 2x_2-x_2 ^ 2 $
$ x_1 (2-x_1) & gt; x_ 2 (2-x_2) $
Śledzenie od $ x_1 & gt; x_2 $,
$ 2-x_1 & lt; 2-x_2 $
$ x_1 (2-x_1) & gt; x_ 2 (2-x_2) $ za 0 $ & lt; x_1 qq 1 $ i 0 $ & lt; x_2 & lt; 1 $
i
$ x_2 (2-x_2) & gt; x_ 1 (2-x_1) $ za $ x_1 & gt; 1 $ i $ x_2 ge 1 $, gdzie $ x_2 & lt; x_1 $
Dlatego, aby zmaksymalizować wypłatę każdego gracza i znaleźć przecięcie ich najlepszej odpowiedzi, tak że nie będą mieli motywacji do odbiegania, pod warunkiem, że $ [0, M] $, stwierdzamy, że:
Tak długo, jak 0 $
Nie jestem jednak pewien, czy mam rację, i chciałbym zdobyć trochę informacji!
źródło