Osborne, równowaga Nasha i poprawność przekonań

12

We wstępie do teorii gier Osborne'a równowaga Nasha opisana jest następująco (s. 21–22):

Po pierwsze, każda gracz wybiera swoją akcję zgodnie z modelem racjonalnego wyboru, biorąc pod uwagę jej przekonania na temat działań innych graczy. Po drugie, przekonanie każdego gracza o działaniach innych graczy jest prawidłowe.

Wydaje mi się, że ta definicja nie jest całkowicie równoważna zwykłej definicji równowagi Nasha jako profilu strategii, w którym strategia każdego gracza jest najlepszą odpowiedzią na strategie innych.

Zwykła definicja nie mówi nic o przekonaniach i dlatego dopuszcza możliwość, że przekonania mogą być niepoprawne.

Aby wziąć trywialną możliwość, rozważ Dylemat Więźnia. Załóżmy, że każdy gracz wierzy, że drugi gracz się nie przyzna. Ponieważ spowiedź jest dominującą strategią, każdy gracz wciąż się przyzna. Tak więc działania stanowią równowagę Nasha, mimo że przekonania graczy są całkowicie przeciwne do rzeczywistych działań równowagi.

Czy mam rację, rozumiejąc, że definicja Osborne'a charakteryzuje coś innego niż równowaga Nasha?

Jyotirmoy Bhattacharya
źródło
Nie „Zwykła definicja nie mówi nic o przekonaniach i dlatego dopuszcza możliwość, że przekonania mogą być niepoprawne”. Po prostu zależy od tego, że w tych definicjach zawsze masz podstawowe założenie racjonalności?
Najgorszy

Odpowiedzi:

9

Wprowadzenie tutaj języka przekonań jest nieco dziwne, biorąc pod uwagę, że przekonania mają bardzo konkretne znaczenie w innych częściach teorii gier.

Rzeczywiście, opis Osborne'a przypomina równowagę Bayesa Nasha. Mogliśmy wprowadzić pojęcie przekonań do normalnej postaci informacji kompletną grę w następujący sposób: załóżmy, że z prawdopodobieństwem każdego gracza, , jest „strategicznym” typ , którzy będą grać według (NASH) równowadze oraz z prawdopodobieństwem wybierze dowolną strategię jednolicie losowo (ponieważ, powiedzmy, jest obojętny na wszystkie akcje). Mamy więc grę bayesowską, w której myślenie o przekonaniach jest bardziej naturalne. i 1 - a iaii1ai

Rozwiązanie pojęcie Bayesa Nash następnie mówi, że 's strategia musi być optymalna ze względu na spodziewany zabaw indukowane przez innych graczy strategii i przekonań ponad ich typów implikowanych przez . Jeśli spojrzymy na limit jako dla wszystkich to równowaga Bayesa Nasha w tej grze zbiegnie się z koncepcją rozwiązania opisaną przez Osborne.{ a j } j i a i1 ii{aj}jiai1i


Myślę, że powodem, dla którego Osborne tak to napisał, jest pedagogiczny, biorąc pod uwagę, że jest to tekst wprowadzający. Kiedy wprowadzenie studentów do gry statycznych, mówimy im, że gracz najlepsze reaguje na poczynania innych graczy. Studenci naturalnie chcą wiedzieć „jak mogą zareagować na wybraną strategię jednocześnie, nie wiedząc, jaka będzie ta strategia?” Jest to pod wieloma względami pytanie filozoficzne. Typowe odpowiedzi toi

  • Jeśli w tę grę często się gra (odkładając na bok kwestie innych wyników, które można utrzymać w powtarzanych grach), możemy myśleć o Nash jako o równowadze w tym sensie, że jeśli się tam zbiegniemy, możemy opracować normę, dzięki której ludzie będą kontynuować grać w tej równowadze w nieskończoność (i oczekiwać, że inni zrobią to samo).
  • Jeśli gra jest naprawdę jednorazowa, zwykle przywołujemy pomysł, że gracze będą próbowali przewidzieć, co zrobią inni - a nasze pojęcie równowagi zawiera ideę, że te prognozy muszą być poprawne.

Wydaje się, że prognozy w drugim punkcie odpowiadają „przekonaniom” przywołanym przez Osborne. Należy jednak podkreślić, że te przewidywania / „przekonania” są jedynie nieformalnym / intuicyjnym narzędziem pomagającym nam w konceptualizacji tego, co dzieje się w równowadze, i nie są częścią definicji takiej równowagi. Pojęcie równowagi Nasha samo w sobie jest całkowicie agnostyczne wobec pojęcia przekonań (jak zauważono w komentarzu, jest ono definiowane wyłącznie w odniesieniu do działań), dlatego Osborne formalnie definiuje równowagę Nasha, czyniąc to bez wzywania idea przekonań w ogóle.

Wszechobecny
źródło
4

Wprowadzenie wiary sprawia, że ​​koncepcja NE jest porównywalna z innymi koncepcjami wyrafinowania, takimi jak PBE i równowaga sekwencyjna, ale znaczenie NE nie ulega zmianie.

Wynik tego uzyskał absolwent mikro-podręcznika Mas-Colella, Whinstona i Greena (MWG)

Twierdzenie 9.C.1. Profil strategia jest równowaga Nasha rozległego formie gra wtedy i tylko wtedy, gdy istnieje system przekonania takie, żeΓ E μσΓEμ

  1. Profil strategii jest sekwencyjnie racjonalny, biorąc pod uwagę system przekonań we wszystkich zestawach informacji tak że .σμ HPr(H|σ)>0
  2. System przekonań wywodzi się z profilu strategii za pomocą reguły Bayesa, gdy tylko jest to możliwe.μσ

Tak więc przykład Dylematu Więźnia podajesz tam, gdzie gracze mają przekonania przeciwne do tego, co rzeczywista strategia przeciwnika nie spełnia drugiego warunku, który wymaga przekonań, gdy tylko jest to możliwe, z reguły Bayesa. W rzeczywistości jest to matematyczny odpowiednik drugiego wymogu definicji Osborne'a: ​​przekonanie gracza o działaniach innych graczy jest prawidłowe.

Pan K.
źródło
Myślę, że istnieje różnica między MWG a Osborne. MWG twierdzą, że dla równowagi Nasha „istnieje” system przekonań, który czyni go sensownym. Milczymy na temat tego, jakie wierzenia mają gracze. Osborne mówi, że gracze faktycznie mają przekonania i są słuszni. Myślałem, że to ostatnie zmienia koncepcyjne znaczenie NE, ponieważ zwykła definicja w ogóle nie wspomina o przekonaniach, a przykład Dylematu Więźnia pokazuje, że strategie nie jednoznacznie determinują przekonania.
Jyotirmoy Bhattacharya
@JototoyoyBhattacharya: Nie sądzę, że MWG „milczy na temat tego, jakie przekonania, jeśli w ogóle, gracze mają”. Warunek 2 zdania wymaga, aby przekonanie to wywodziło się z profilu strategii równowagi przy użyciu reguły Bayesa, gdy tylko jest to możliwe. Tak więc w przykładzie PD, gdy jeden gracz wybiera defekt z prawdopodobieństwem 1, przekonanie drugiego gracza musi również postawić prawdopodobieństwo 1 na defekcie akcji i najlepiej zareagować, biorąc pod uwagę takie przekonanie (co prowadzi do wyboru przez niego defektu).
Herr K.
@JyotirmoyBhattacharya: Wiara w NE nie musi być jednak wyjątkowa. Wynika to z faktu, że jeśli dla danej równowagi ścieżka drzewa gry jest przyjmowana z prawdopodobieństwem zerowym, wówczas zasada Bayesa nie ma zastosowania, a zatem wszelkie przekonania na tej ścieżce byłyby uważane za „poprawne” w NE. Z tego powodu wprowadzono udoskonalenia, takie jak równowaga sekwencyjna, aby wykluczyć nieuzasadnione przekonania ze ścieżek równowagi.
Herr K.
@JyotirmoyBhattacharya: Ponadto, ponieważ jest to podręcznik licencjacki, Osborne mógł wybrać język, który jest bardziej intuicyjny niż rygorystyczny matematycznie z powodów pedagogicznych. Dla mnie dwa warunki w definicji Osborne'a są dokładnymi odpowiednikami propozycji MWG.
Herr K.
3

Przykład dylematu więźnia działa tylko dlatego, że jest to gra z dominującymi strategiami. Osborne ma rację.

Aby najlepiej reagować na strategię innego gracza, tak jak w definicji, którą podajesz, muszę znać jego strategię. Innymi słowy, muszę mieć przekonania o tym, co robią, a przekonania te muszą być poprawne. Jest to wzmocnienie koncepcji racjonalizacji.

Ciekawe jest to, jak uzyskać dziwne „równowagi” w grach z dominującymi strategiami. Odpowiada to ekwiwalentowi wyników i gdzie może się mylić i kładzie pozytywny nacisk na nieracjonalne strategie. Ale nigdy nie widziałem równowagi Nasha, która obejmowałaby przekonania. Definicje, które pamiętam, „profil strategii jest równowagą Nasha, jeśli(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... ”Uważam, że oznacza to, że zdefiniowanie przekonań jest niepotrzebne, ponieważ przekonania są dokładnie poprawną oceną profilu strategii. Odwołanie, jedna z moich książek, podaje zwykłą definicję z cytatem Nasha (1950), i następnie omawia dwa podstawowe założenia. Jedno z nich to poprawne przekonania, a drugie to racjonalna gra, biorąc pod uwagę te poprawne przekonania.

Pburg
źródło
Ale obalenie czegoś wystarczy jeden kontrprzykład. Jeśli weźmiesz Osborne'a za twierdzącego, że jego definicja jest równoważna definicji Nasha, to w jaki sposób można traktować kontrprzykład Dylemat Więźnia. Rozumiem, że definicja Osborne'a jest wzmocnieniem racjonalizmu, twierdzę, że nie jest to równowaga Nasha z tego prostego powodu, że tutaj równowaga jest definiowana nad działaniami i przekonaniami, podczas gdy równowaga Nasha całkowicie milczy na temat przekonań.
Jyotirmoy Bhattacharya
1
To jest definicja, a nie dowód.
Pburg
Słusznie. Ale jest to definicja pojęcia, która ma już inną dobrze przyjętą definicję. Oczekuję więc, że jeśli autor nie wspomina inaczej, twierdzi, że dwie definicje są równoważne.
Jyotirmoy Bhattacharya
dla jasności, czy umieszcza te komentarze w definicji, czy w dyskusji? ps Zredagowałem swoją odpowiedź
Pburg,
Część, którą zacytowałem, to dyskusja. Zaraz potem mówi (s. 22) „Te dwa elementy są zawarte w następującej definicji”, a następnie podaje standardową definicję w kategoriach najlepszej reakcji na strategie, w których w ogóle nie wspomina się o przekonaniach. Więc gdzie są zawarte w definicji przekonania? Problem nie dotyczy tylko gier z dominującymi strategiami. Możliwe jest budowanie przykładów, w których nie ma dominujących strategii, ale strategie równowagi Nasha są najlepszymi odpowiedziami na przekonania inne niż gra równowagi.
Jyotirmoy Bhattacharya
2

Mogę powtarzać rzeczy, które zostały wcześniej powiedziane, ale oto moje zdanie na ten temat.

Myślę, że napotykamy zwykły problem przy porównywaniu dwóch różnych modeli. To, co oznacza „równoważność”, nie jest całkowicie oczywiste, ponieważ dwie definicje dotyczą różnych światów lub różnych modeli. Jeśli jednak „równoważność” jest właściwie zdefiniowana, myślę, że można zrozumieć definicję Osborne'a i pokazać, że jest ona rzeczywiście „równoważna” NE.

Koncepcja rozwiązania leżąca u podstaw cytowanej sekcji wyglądałaby następująco:

Wiara równowaga (BE):> Profil strategii i profil przekonań w którym dla wszystkich graczysbi

ui(si | si=bi)ui(s | si=bi) for all sSi
i
bi=si

Problemem, jeśli mamy dojść do jakiegokolwiek stwierdzenia „równoważności”, jest to, że z jednej strony mamy BE, która „żyje” w świecie z… przekonaniami, az drugiej strony pojęcie NE, które żyje w świecie ... z wyłączeniem przekonań. Co zatem oznaczałoby wyrażenie równoważności, takie jak „NE BE”?

1) BE NE

Ten kierunek implikacji jest prawdopodobnie niekontrowersyjny, ponieważ przechodzimy od bardziej złożonego do prostszego modelu. „Każdy BE jest NE” powinien oznaczać, że jeśli spojrzymy na profil strategii równowagi samego BE (to znaczy bez jego wspierającego profilu wierzeń ), powinien to być NE. Można sprawdzić, czy tak jest.p

2) NE BE

To trudna część. Co to znaczy, że „każdy NE jest BE”? Na pewno nie to, że „NE plus jakikolwiek profil przekonań jest BE”, jak pokazał PO swoim przykładem. Jednak jest tak, że „każdy NE może być BE dla jakiegoś profilu przekonań ”. Myślę, że w tym sensie należy zrozumieć twierdzenie Osborne dotyczące „równoważności”

Zauważ, że mamy również następującą, bardziej „równoważną” deklarację: „ Wynik gry jest wynikiem NE, i tylko wtedy, gdy jest wynikiem BE”.

Martin Van der Linden
źródło
Ale każda BE nie jest NE, ponieważ koncepcja BE jest osłabieniem racjonalizmu, który jest nam słabszy niż NE.
Jyotirmoy Bhattacharya
Jak napisałem, mam problem ze zrozumieniem, co to znaczy, że BE „nie jest” NE, ponieważ wydają się żyć w różnych modelach. Czy masz na myśli, że niektóre strategie rozgrywane na BE nie są NE? Myślałem, że to nieprawda, ale mogłem coś przeoczyć. Jeśli to masz na myśli, czy możesz wskazać mi swój przykład? To byłoby bardzo pomocne.
Martin Van der Linden,
Nie jestem pewien, czy BE jest osłabieniem racjonalizacji. W moim rozumieniu BE to racjonalność wraz z warunkiem, że przypuszczenia są prawidłowe, prawda? Jeśli to prawda, to czy NIE bylibyśmy silniejsi niż racjonalność? (może to oczywiście zależeć od tak zwanej koncepcji „słabszego / silniejszego”)
Martin Van der Linden,