Załóżmy, że jest to gra z sygnalizacji skończonej przestrzeni wiadomości , skończonej akcji przestrzeni i skończonej przestrzeni typu . Jeszcze prościej, wszystkie typy nadawców mają identyczne preferencje (odbiorca po prostu woli różne akcje w odpowiedzi na różne typy). Czy odbiorca może kiedykolwiek lepiej sobie radzić, losowo odpowiadając na odpowiedzi? Kiedy istnieje równowaga, w której odbiorca podejmuje tylko czyste działania?
Wszechobecnie ładnie streściło moje pytanie: „Czy kiedykolwiek zdarza się, że równowaga z najwyższymi wypłatami z odbiorcy wiąże się koniecznie z mieszanymi strategiami?”
Chodźmy z równowagą sekwencyjną. Jeśli chcesz na początek notacji.
to prawdopodobieństwo, że wysyła .
to prawdopodobieństwo, że odbiornik nie odpowie na z podaje przekonania odbiorcy po zaobserwowaniu .
Równowaga sekwencyjna wymaga, aby dawało optymalne odpowiedzi, biorąc pod uwagę , jest optymalne, biorąc pod uwagę a jest bayesowskie, biorąc pod uwagę . To jest naprawdę definicja słabej sekwencji, ale w grze sygnalizacyjnej nie ma rozróżnienia.
Moja intuicja mówi „nie”, gdy istnieje równowaga, w której odbiornik gra tylko czyste działania, ale zawsze byłem okropny z tego rodzaju rzeczami. Być może musimy również stwierdzić, że nie jest to gra o sumie zerowej, ale mówię to tylko dlatego, że pamiętam, że gracze byli lepsi z możliwością losowania w tych grach. Być może jest to gdzieś przypis w gazecie?
Rozważ grę poniżej, w której preferencje nadawcy nie są identyczne. Przepraszam za niską jakość. Istnieją trzy typy nadawców, z których każdy jest jednakowo prawdopodobny. Możemy stworzyć optymalną równowagę odbiorcy (gracza 2) tylko wtedy, gdy losują po otrzymaniu wiadomości 1. Wówczas typy 1 i 3 będą grać , tworząc równowagę oddzielającą. Jeśli odbiornik zastosuje czystą strategię w odpowiedzi na m 1 , wówczas typ 1 lub 2 odejdzie i pogorszy odbiornik.
źródło
Odpowiedzi:
Być może mam kontrprzykład!
Zestaw odpowiedzi odbiorcy na wiadomość to { a , r }m=m1,m2 {a,r}
u R ( t 3 , m i , a ) = 1uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1
u R ( t 3 , m i , r ) = 2uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2
Następnie w równowadze wszyscy nadawcy muszą uzyskać to samo narzędzie, prawda ?. W przeciwnym razie jeden naśladuje strategię drugiego.
Zatem jedyną czystą równowagą strategiczną jest, aby wszyscy nadawcy wybrali . W równaniu puli na lub najlepszą odpowiedzią jest wybór . Nie ma czystej strategii oddzielającej równowagę, z wyjątkiem sytuacji, gdy i wysyłają , a odbiorca odpowiada . Wtedy jest obojętny między wszystkimi wiadomościami, ponieważ na pewno spotka się z wypłatą . Wszystko to daje odbiorcy wypłatęm 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3 m1 m2 r t1 t2 m2 r t3 0 32−ϵ
Następnie rozważ przypadek, w którym iTeraz nadawcy są obojętni między wysyłaniem tych dwóch wiadomości. Następnie niech i dla . Wtedy strategia odbiorcy jest racjonalna.σ m 2 R ( ) = 1. σ T 3 ( m +1 ) = ε + 1 / 4σm1R(a)=β σm2R(a)=1. σTi(mI)=1i=1,2σt3(m1)=ϵ+1/4−ϵ+1/2=1−σt3(m1) σti(mi)=1 i=1,2
Oczekiwana użyteczność odbiornika od dla lub wynosi 1,5. Oczekiwana użyteczność od jest nieco powyżej 1,5, biorąc uwagę . Tak więc oczekiwana wypłata ex ante jest wyższa niż , lepsza niż czysta równowaga opisana powyżej. Co więcej, ten rozdział utrzymuje się tylko przez mieszanie. Każda inna czysta strategia przyjęta przez odbiorcę spowoduje pulę nadawców, co oznacza, że jedyną czystą strategią równowagi jest sytuacja, gdy odbiorca wybiera . a r m 2 a 3m1 a r m2 a r32−ϵ r
I powinny mieć s na obrazku poniżej, dla lewej wypłat strona nadawcy do . Myślę, że jest kluczowym składnikiem.a β < 1β a β<1
źródło
Myślę, że to nie może się zdarzyć z awersją do ryzyka, ryzyko nadawców neutralnym odbiornika i wystarczająco bogaty.A
Na przykład, aby trzymać się kanonicznego modelu sygnalizacji, załóżmy, że jest dodatnią rzeczywistą linią, a użyteczność nadawców wzrasta w momencie, a użyteczność odbiornika ma liniową użyteczność w .a a aA u a a
(Trzeba przyznać, że jest to tylko częściowa odpowiedź, ponieważ ramy są znacznie mniej ogólne niż te zawarte w pytaniu, więc może nie być dla Ciebie zadowalające. W dalszym ciągu przedstawiam argument, jeśli zgadzasz się z tymi założeniami)
Aby wyprowadzić sprzeczność, załóżmy, że w równowagowej i w przypadku niektórych . Pozwolićσ m R ( a ″ ) > 0 a ′ ≠ a ″ ∈ AσmR(a′)>0 σmR(a′′)>0 a′≠a′′∈A
Przez awersję do ryzyka
Przy pewnym założeniu ciągłości muszą istnieć również
takie, że
Rozważmy więc skonstruowany w następujący sposóbσmR′
Odbiorcy wolą niż jeśli nie zmieniają sygnałów wysyłanych przez nadawców, ponieważ wiąże się to z mniejszymi oczekiwanymi kompensacjami. Ale z nadawcy są obojętni między i , więc powinni wysyłać te same sygnały, co w . Zatem nie może być równowagą, która pokazuje, że nie możemy mieć dwóch różnych akcji granych z prawdopodobieństwem dodatnim w równowadze. Σ m R σ m RσmR′ σmR Σ m R σ m R σ m RσmR′ σmR σmR σmR
źródło