Kiedy odbiornik powinien losowo wybierać akcje w grze sygnalizacyjnej?

10

Załóżmy, że jest to gra z sygnalizacji skończonej przestrzeni wiadomości M , skończonej akcji przestrzeni A i skończonej przestrzeni typu T . Jeszcze prościej, wszystkie typy nadawców mają identyczne preferencje (odbiorca po prostu woli różne akcje w odpowiedzi na różne typy). Czy odbiorca może kiedykolwiek lepiej sobie radzić, losowo odpowiadając na odpowiedzi? Kiedy istnieje równowaga, w której odbiorca podejmuje tylko czyste działania?

Wszechobecnie ładnie streściło moje pytanie: „Czy kiedykolwiek zdarza się, że równowaga z najwyższymi wypłatami z odbiorcy wiąże się koniecznie z mieszanymi strategiami?”

Chodźmy z równowagą sekwencyjną. Jeśli chcesz na początek notacji.

σt(m) to prawdopodobieństwo, żetT wysyłamM .

σRm(a) to prawdopodobieństwo, że odbiornik nie odpowie nam zaA. μmΔT podaje przekonania odbiorcy po zaobserwowanium .

Równowaga sekwencyjna wymaga, aby σt dawało optymalne odpowiedzi, biorąc pod uwagę σR , σR jest optymalne, biorąc pod uwagę μ a μ jest bayesowskie, biorąc pod uwagę σ . To jest naprawdę definicja słabej sekwencji, ale w grze sygnalizacyjnej nie ma rozróżnienia.

Moja intuicja mówi „nie”, gdy istnieje równowaga, w której odbiornik gra tylko czyste działania, ale zawsze byłem okropny z tego rodzaju rzeczami. Być może musimy również stwierdzić, że nie jest to gra o sumie zerowej, ale mówię to tylko dlatego, że pamiętam, że gracze byli lepsi z możliwością losowania w tych grach. Być może jest to gdzieś przypis w gazecie?

Rozważ grę poniżej, w której preferencje nadawcy nie są identyczne. Przepraszam za niską jakość. Istnieją trzy typy nadawców, z których każdy jest jednakowo prawdopodobny. Możemy stworzyć optymalną równowagę odbiorcy (gracza 2) tylko wtedy, gdy losują po otrzymaniu wiadomości 1. Wówczas typy 1 i 3 będą grać , tworząc równowagę oddzielającą. Jeśli odbiornik zastosuje czystą strategię w odpowiedzi na m 1 , wówczas typ 1 lub 2 odejdzie i pogorszy odbiornik.m2m1

σRm1(a)=.5=σRm1(r)=.5

wprowadź opis zdjęcia tutaj

Pburg
źródło
Czy działania podejmowane przez odbiorcę jako funkcja typu mają wpływ na wiadomość wysyłaną przez nadawcę, czy są one niezależne?
Martin Van der Linden
Nie jestem do końca pewien, co masz na myśli. Istnieje jeden typ odbiornika. Ich strategia mapuje wiadomości w podziale na działania. Mają one wpływ na wiadomość tylko w takim stopniu, w jakim nadawcy odgrywają najlepszą odpowiedź.
Pburg
2
Załóżmy, że istnieje równowaga, w której odbiornik randomizuje zestaw działań . Oznacza to, z definicji, że musi on być obojętny między dowolnymi dwoma rozkładami prawdopodobieństwa w stosunku do α - w tym tymi, w których całą wagę przykłada się do jednego działania (czyste strategie). Tak więc nie, strategia mieszana nigdy nie może być lepsza od najlepszej strategii czystej. Czy też źle zrozumiałem pytanie? αα
Wszechobecny
@ Wszechobecne To ma dla mnie sens, ale zastanawiałem się, czy mogą być jakieś dziwne przypadki patologiczne. Na przykład mogłem znaleźć tylko twierdzenie: „W przypadku ogólnych wyborów wypłat w skończonej grze o rozbudowanej formie z doskonałym przywołaniem wypłaty są stałe dla każdego połączonego elementu sekwencyjnych równowag”. Ogólne zastrzeżenie mnie zastanawiało.
Pburg
1
@Pburg Tak, rozumiem. Wygląda na to, że mieliśmy na myśli różne pytania. Pomyślałem sobie: „czy to jest tak, że jedyna w swoim rodzaju najlepsza reakcja odbiorcy na daną strategię nadawcy jest strategią mieszaną?”, Podczas gdy wydaje się, że twoje pytanie jest w rzeczywistości „czy zdarza się, że równowaga z najwyższymi wypłatami z odbiorcy koniecznie obejmuje mieszane strategie? ”
Wszechobecny

Odpowiedzi:

3

Być może mam kontrprzykład!

m1,m2,m3t1,t2,t3Pr(t=t2)=1Pr(t=t3)=12ϵ Pr(t=t1)=1Pr(t=t2)=14m30Pr(t=t1)=14+ϵm30

Zestaw odpowiedzi odbiorcy na wiadomość to { a , r }m=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

u R ( t 3 , m i , a ) = 1uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1

u R ( t 3 , m i , r ) = 2uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1 .

Następnie w równowadze wszyscy nadawcy muszą uzyskać to samo narzędzie, prawda ?. W przeciwnym razie jeden naśladuje strategię drugiego.

Zatem jedyną czystą równowagą strategiczną jest, aby wszyscy nadawcy wybrali . W równaniu puli na lub najlepszą odpowiedzią jest wybór . Nie ma czystej strategii oddzielającej równowagę, z wyjątkiem sytuacji, gdy i wysyłają , a odbiorca odpowiada . Wtedy jest obojętny między wszystkimi wiadomościami, ponieważ na pewno spotka się z wypłatą . Wszystko to daje odbiorcy wypłatęm 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3m1m2rt1t2m2rt3032ϵ

Następnie rozważ przypadek, w którym iTeraz nadawcy są obojętni między wysyłaniem tych dwóch wiadomości. Następnie niech i dla . Wtedy strategia odbiorcy jest racjonalna.σ m 2 R ( ) = 1. σ T 3 ( m +1 ) = ε + 1 / 4σRm1(a)=βσRm2(a)=1.σTi(mI)=1i=1,2σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

Oczekiwana użyteczność odbiornika od dla lub wynosi 1,5. Oczekiwana użyteczność od jest nieco powyżej 1,5, biorąc uwagę . Tak więc oczekiwana wypłata ex ante jest wyższa niż , lepsza niż czysta równowaga opisana powyżej. Co więcej, ten rozdział utrzymuje się tylko przez mieszanie. Każda inna czysta strategia przyjęta przez odbiorcę spowoduje pulę nadawców, co oznacza, że ​​jedyną czystą strategią równowagi jest sytuacja, gdy odbiorca wybiera . a r m 2 a 3m1arm2ar32ϵr

I powinny mieć s na obrazku poniżej, dla lewej wypłat strona nadawcy do . Myślę, że jest kluczowym składnikiem.a β < 1βaβ<1

wprowadź opis zdjęcia tutaj

Pburg
źródło
3

Myślę, że to nie może się zdarzyć z awersją do ryzyka, ryzyko nadawców neutralnym odbiornika i wystarczająco bogaty.A

Na przykład, aby trzymać się kanonicznego modelu sygnalizacji, załóżmy, że jest dodatnią rzeczywistą linią, a użyteczność nadawców wzrasta w momencie, a użyteczność odbiornika ma liniową użyteczność w .a a aAuaa

(Trzeba przyznać, że jest to tylko częściowa odpowiedź, ponieważ ramy są znacznie mniej ogólne niż te zawarte w pytaniu, więc może nie być dla Ciebie zadowalające. W dalszym ciągu przedstawiam argument, jeśli zgadzasz się z tymi założeniami)

Aby wyprowadzić sprzeczność, załóżmy, że w równowagowej i w przypadku niektórych . Pozwolićσ m R ( a ) > 0 a a AσRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

Przez awersję do ryzyka

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

Przy pewnym założeniu ciągłości muszą istnieć również

a<a

takie, że

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

Rozważmy więc skonstruowany w następujący sposóbσRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • Dla wszystkich innych ,a~σRm(a~)=σRm(a~)

Odbiorcy wolą niż jeśli nie zmieniają sygnałów wysyłanych przez nadawców, ponieważ wiąże się to z mniejszymi oczekiwanymi kompensacjami. Ale z nadawcy są obojętni między i , więc powinni wysyłać te same sygnały, co w . Zatem nie może być równowagą, która pokazuje, że nie możemy mieć dwóch różnych akcji granych z prawdopodobieństwem dodatnim w równowadze. Σ m R σ m RσRmσRm Σ m R σ m R σ m RσRmσRmσRmσRm

Martin Van der Linden
źródło
Czy w tym modelu odbiornik nie zawsze po prostu wybiera ? a=0
Pburg
Niekoniecznie tak jest. Jeśli odbiornik zawsze wybiera bez względu na sygnał, nie zachęca „wysokich” typów do ujawnienia ich typu poprzez „wyższy” sygnał. Może to być optymalne w równowadze sumującej, ale nie w równowadze oddzielającej. Patrz na przykład sekcja 13.C Mas-Colell, Whinston i Green, chociaż konfiguracja znów jest nieco inna niż twoja (np. Dwie firmy rywalizują o pracowników różnych typów)a
Martin Van der Linden
Co zatem oznacza „odbiornik ma użyteczność liniową zmniejszającą się w”?
Pburg
Przepraszam, to nie było bardzo jasne. W modelu sygnalizacji Spence, który mam na myśli, działanie, które podejmuje odbiorca, polega na wypłaceniu nadawcy pensji. Narzędzie odbiorcy zależy od typu nadawcy t minus płaca płacona t − w. Zasadniczo odbiorca jest neutralny pod względem ryzyka: zależy jej tylko na oczekiwanym wynagrodzeniu, które będzie musiała zapłacić, oraz na oczekiwanym typie zatrudnienia.
Martin Van der Linden
Okej, przypuszczam, że widziałem to jako kwadratową stratę,Dzięki za sugestię, choć szukam czegoś bardziej ogólnego, ale z dyskretnymi działaniami. (tw)2.
Pburg