We wstępie do teorii gier Osborne'a równowaga Nasha opisana jest następująco (s. 21–22):
Po pierwsze, każda gracz wybiera swoją akcję zgodnie z modelem racjonalnego wyboru, biorąc pod uwagę jej przekonania na temat działań innych graczy. Po drugie, przekonanie każdego gracza o działaniach innych graczy jest prawidłowe.
Wydaje mi się, że ta definicja nie jest całkowicie równoważna zwykłej definicji równowagi Nasha jako profilu strategii, w którym strategia każdego gracza jest najlepszą odpowiedzią na strategie innych.
Zwykła definicja nie mówi nic o przekonaniach i dlatego dopuszcza możliwość, że przekonania mogą być niepoprawne.
Aby wziąć trywialną możliwość, rozważ Dylemat Więźnia. Załóżmy, że każdy gracz wierzy, że drugi gracz się nie przyzna. Ponieważ spowiedź jest dominującą strategią, każdy gracz wciąż się przyzna. Tak więc działania stanowią równowagę Nasha, mimo że przekonania graczy są całkowicie przeciwne do rzeczywistych działań równowagi.
Czy mam rację, rozumiejąc, że definicja Osborne'a charakteryzuje coś innego niż równowaga Nasha?
źródło
Odpowiedzi:
Wprowadzenie tutaj języka przekonań jest nieco dziwne, biorąc pod uwagę, że przekonania mają bardzo konkretne znaczenie w innych częściach teorii gier.
Rzeczywiście, opis Osborne'a przypomina równowagę Bayesa Nasha. Mogliśmy wprowadzić pojęcie przekonań do normalnej postaci informacji kompletną grę w następujący sposób: załóżmy, że z prawdopodobieństwem każdego gracza, , jest „strategicznym” typ , którzy będą grać według (NASH) równowadze oraz z prawdopodobieństwem wybierze dowolną strategię jednolicie losowo (ponieważ, powiedzmy, jest obojętny na wszystkie akcje). Mamy więc grę bayesowską, w której myślenie o przekonaniach jest bardziej naturalne. i 1 - a iai i 1−ai
Rozwiązanie pojęcie Bayesa Nash następnie mówi, że 's strategia musi być optymalna ze względu na spodziewany zabaw indukowane przez innych graczy strategii i przekonań ponad ich typów implikowanych przez . Jeśli spojrzymy na limit jako dla wszystkich to równowaga Bayesa Nasha w tej grze zbiegnie się z koncepcją rozwiązania opisaną przez Osborne.{ a j } j ≠ i a i → 1 ii {aj}j≠i ai→1 i
Myślę, że powodem, dla którego Osborne tak to napisał, jest pedagogiczny, biorąc pod uwagę, że jest to tekst wprowadzający. Kiedy wprowadzenie studentów do gry statycznych, mówimy im, że gracz najlepsze reaguje na poczynania innych graczy. Studenci naturalnie chcą wiedzieć „jak mogą zareagować na wybraną strategię jednocześnie, nie wiedząc, jaka będzie ta strategia?” Jest to pod wieloma względami pytanie filozoficzne. Typowe odpowiedzi toi
Wydaje się, że prognozy w drugim punkcie odpowiadają „przekonaniom” przywołanym przez Osborne. Należy jednak podkreślić, że te przewidywania / „przekonania” są jedynie nieformalnym / intuicyjnym narzędziem pomagającym nam w konceptualizacji tego, co dzieje się w równowadze, i nie są częścią definicji takiej równowagi. Pojęcie równowagi Nasha samo w sobie jest całkowicie agnostyczne wobec pojęcia przekonań (jak zauważono w komentarzu, jest ono definiowane wyłącznie w odniesieniu do działań), dlatego Osborne formalnie definiuje równowagę Nasha, czyniąc to bez wzywania idea przekonań w ogóle.
źródło
Wprowadzenie wiary sprawia, że koncepcja NE jest porównywalna z innymi koncepcjami wyrafinowania, takimi jak PBE i równowaga sekwencyjna, ale znaczenie NE nie ulega zmianie.
Wynik tego uzyskał absolwent mikro-podręcznika Mas-Colella, Whinstona i Greena (MWG)
Tak więc przykład Dylematu Więźnia podajesz tam, gdzie gracze mają przekonania przeciwne do tego, co rzeczywista strategia przeciwnika nie spełnia drugiego warunku, który wymaga przekonań, gdy tylko jest to możliwe, z reguły Bayesa. W rzeczywistości jest to matematyczny odpowiednik drugiego wymogu definicji Osborne'a: przekonanie gracza o działaniach innych graczy jest prawidłowe.
źródło
Przykład dylematu więźnia działa tylko dlatego, że jest to gra z dominującymi strategiami. Osborne ma rację.
Aby najlepiej reagować na strategię innego gracza, tak jak w definicji, którą podajesz, muszę znać jego strategię. Innymi słowy, muszę mieć przekonania o tym, co robią, a przekonania te muszą być poprawne. Jest to wzmocnienie koncepcji racjonalizacji.
Ciekawe jest to, jak uzyskać dziwne „równowagi” w grach z dominującymi strategiami. Odpowiada to ekwiwalentowi wyników i gdzie może się mylić i kładzie pozytywny nacisk na nieracjonalne strategie. Ale nigdy nie widziałem równowagi Nasha, która obejmowałaby przekonania. Definicje, które pamiętam, „profil strategii jest równowagą Nasha, jeśli(σ,μ1) (σ,μ2) μ2 σ∈Σ σi∈Bi(σ−i) ... ”Uważam, że oznacza to, że zdefiniowanie przekonań jest niepotrzebne, ponieważ przekonania są dokładnie poprawną oceną profilu strategii. Odwołanie, jedna z moich książek, podaje zwykłą definicję z cytatem Nasha (1950), i następnie omawia dwa podstawowe założenia. Jedno z nich to poprawne przekonania, a drugie to racjonalna gra, biorąc pod uwagę te poprawne przekonania.
źródło
Mogę powtarzać rzeczy, które zostały wcześniej powiedziane, ale oto moje zdanie na ten temat.
Myślę, że napotykamy zwykły problem przy porównywaniu dwóch różnych modeli. To, co oznacza „równoważność”, nie jest całkowicie oczywiste, ponieważ dwie definicje dotyczą różnych światów lub różnych modeli. Jeśli jednak „równoważność” jest właściwie zdefiniowana, myślę, że można zrozumieć definicję Osborne'a i pokazać, że jest ona rzeczywiście „równoważna” NE.
Koncepcja rozwiązania leżąca u podstaw cytowanej sekcji wyglądałaby następująco:
Problemem, jeśli mamy dojść do jakiegokolwiek stwierdzenia „równoważności”, jest to, że z jednej strony mamy BE, która „żyje” w świecie z… przekonaniami, az drugiej strony pojęcie NE, które żyje w świecie ... z wyłączeniem przekonań. Co zatem oznaczałoby wyrażenie równoważności, takie jak „NE BE”?⇔
1) BE NE⇒
Ten kierunek implikacji jest prawdopodobnie niekontrowersyjny, ponieważ przechodzimy od bardziej złożonego do prostszego modelu. „Każdy BE jest NE” powinien oznaczać, że jeśli spojrzymy na profil strategii równowagi samego BE (to znaczy bez jego wspierającego profilu wierzeń ), powinien to być NE. Można sprawdzić, czy tak jest.p
2) NE BE⇒
To trudna część. Co to znaczy, że „każdy NE jest BE”? Na pewno nie to, że „NE plus jakikolwiek profil przekonań jest BE”, jak pokazał PO swoim przykładem. Jednak jest tak, że „każdy NE może być BE dla jakiegoś profilu przekonań ”. Myślę, że w tym sensie należy zrozumieć twierdzenie Osborne dotyczące „równoważności”
Zauważ, że mamy również następującą, bardziej „równoważną” deklarację: „ Wynik gry jest wynikiem NE, i tylko wtedy, gdy jest wynikiem BE”.
źródło