Kiedy odbiornik powinien losowo wybierać akcje w grze sygnalizacyjnej?

Załóżmy, że jest to gra z sygnalizacji skończonej przestrzeni wiadomości $M$ , skończonej akcji przestrzeni $A$ i skończonej przestrzeni typu $T$ . Jeszcze prościej, wszystkie typy nadawców mają identyczne preferencje (odbiorca po prostu woli różne akcje w odpowiedzi na różne typy). Czy odbiorca może kiedykolwiek lepiej sobie radzić, losowo odpowiadając na odpowiedzi? Kiedy istnieje równowaga, w której odbiorca podejmuje tylko czyste działania?

Wszechobecnie ładnie streściło moje pytanie: „Czy kiedykolwiek zdarza się, że równowaga z najwyższymi wypłatami z odbiorcy wiąże się koniecznie z mieszanymi strategiami?”

Chodźmy z równowagą sekwencyjną. Jeśli chcesz na początek notacji.

$\sigma_{t}(m)$ to prawdopodobieństwo, że $t\in T$ wysyła $m\in M$ .

$\sigma_R^m(a)$ to prawdopodobieństwo, że odbiornik nie odpowie na $m$ z $a\in A.$ $\mu^m \in \Delta T$ podaje przekonania odbiorcy po zaobserwowaniu $m$ .

Równowaga sekwencyjna wymaga, aby $\sigma_t$ dawało optymalne odpowiedzi, biorąc pod uwagę $\sigma_R$ , $\sigma_R$ jest optymalne, biorąc pod uwagę $\mu$ a $\mu$ jest bayesowskie, biorąc pod uwagę $\sigma$ . To jest naprawdę definicja słabej sekwencji, ale w grze sygnalizacyjnej nie ma rozróżnienia.

Moja intuicja mówi „nie”, gdy istnieje równowaga, w której odbiornik gra tylko czyste działania, ale zawsze byłem okropny z tego rodzaju rzeczami. Być może musimy również stwierdzić, że nie jest to gra o sumie zerowej, ale mówię to tylko dlatego, że pamiętam, że gracze byli lepsi z możliwością losowania w tych grach. Być może jest to gdzieś przypis w gazecie?

Rozważ grę poniżej, w której preferencje nadawcy nie są identyczne. Przepraszam za niską jakość. Istnieją trzy typy nadawców, z których każdy jest jednakowo prawdopodobny. Możemy stworzyć optymalną równowagę odbiorcy (gracza 2) tylko wtedy, gdy losują po otrzymaniu wiadomości 1. Wówczas typy 1 i 3 będą grać , tworząc równowagę oddzielającą. Jeśli odbiornik zastosuje czystą strategię w odpowiedzi na , wówczas typ 1 lub 2 odejdzie i pogorszy odbiornik. $m_2$ $m_1$

$\sigma_R^{m_1}(a)=.5=\sigma_R^{m_1}(r)=.5$

wprowadź opis zdjęcia tutaj

game-theory Pburg
źródło

Czy działania podejmowane przez odbiorcę jako funkcja typu mają wpływ na wiadomość wysyłaną przez nadawcę, czy są one niezależne?

Martin Van der Linden

Nie jestem do końca pewien, co masz na myśli. Istnieje jeden typ odbiornika. Ich strategia mapuje wiadomości w podziale na działania. Mają one wpływ na wiadomość tylko w takim stopniu, w jakim nadawcy odgrywają najlepszą odpowiedź.

Pburg

Załóżmy, że istnieje równowaga, w której odbiornik randomizuje zestaw działań

. Oznacza to, z definicji, że musi on być obojętny między dowolnymi dwoma rozkładami prawdopodobieństwa w stosunku do

w tym tymi, w których całą wagę przykłada się do jednego działania (czyste strategie). Tak więc nie, strategia mieszana nigdy nie może być lepsza od najlepszej strategii czystej. Czy też źle zrozumiałem pytanie?

α

$\alpha$

α

$\alpha$

Wszechobecny

@ Wszechobecne To ma dla mnie sens, ale zastanawiałem się, czy mogą być jakieś dziwne przypadki patologiczne. Na przykład mogłem znaleźć tylko twierdzenie: „W przypadku ogólnych wyborów wypłat w skończonej grze o rozbudowanej formie z doskonałym przywołaniem wypłaty są stałe dla każdego połączonego elementu sekwencyjnych równowag”. Ogólne zastrzeżenie mnie zastanawiało.

Pburg

@Pburg Tak, rozumiem. Wygląda na to, że mieliśmy na myśli różne pytania. Pomyślałem sobie: „czy to jest tak, że jedyna w swoim rodzaju najlepsza reakcja odbiorcy na daną strategię nadawcy jest strategią mieszaną?”, Podczas gdy wydaje się, że twoje pytanie jest w rzeczywistości „czy zdarza się, że równowaga z najwyższymi wypłatami z odbiorcy koniecznie obejmuje mieszane strategie? ”

Wszechobecny

Odpowiedzi:

Być może mam kontrprzykład!

$m_1, m_2,$ $m_3$ $t_1,t_2,t_3$ $\Pr(t=t_3)=\frac{1}{2}-\epsilon$ $\Pr(t=t_2)=\frac{1}{4}$ $\Pr(t=t_1)=\frac{1}{4}+\epsilon$ $m_3$ $0$

Zestaw odpowiedzi odbiorcy na wiadomość to $m=m_1,m_2$ $\{a,r\}$

$u_t(a,m_1)=1 > u_t(a,m_2)=\beta>u_t(r,\cdot)=0$

$u_R(t_1,m_1,a)=u_R(t_2,m_2,a)=2$ , , $u_R(t_3,m_i,a)=1$

$u_R(t_2,m_1,a)=u_R(t_2,m_1,a)=0$ , , $u_R(t_3,m_i,r)=2$

$u_R(t_1,m_i,r)=u_R(t_2,m_i,r)=1$ .

Następnie w równowadze wszyscy nadawcy muszą uzyskać to samo narzędzie, prawda ?. W przeciwnym razie jeden naśladuje strategię drugiego.

Zatem jedyną czystą równowagą strategiczną jest, aby wszyscy nadawcy wybrali . W równaniu puli na lub najlepszą odpowiedzią jest wybór . Nie ma czystej strategii oddzielającej równowagę, z wyjątkiem sytuacji, gdy i wysyłają , a odbiorca odpowiada . Wtedy jest obojętny między wszystkimi wiadomościami, ponieważ na pewno spotka się z wypłatą . Wszystko to daje odbiorcy wypłatę $m_3$ $m_1$ $m_2$ $r$ $t_1$ $t_2$ $m_2$ $r$ $t_3$ $0$ $\frac{3}{2}-\epsilon$

Następnie rozważ przypadek, w którym iTeraz nadawcy są obojętni między wysyłaniem tych dwóch wiadomości. Następnie niech i dla . Wtedy strategia odbiorcy jest racjonalna. $\sigma_R^{m_1}(a)=\beta$ $\sigma_R^{m_2}(a)=1.$ $\sigma_{t_3}(m_1)=\frac{\epsilon+1/4}{-\epsilon+1/2}=1-\sigma_{t_3}(m_1)$ $\sigma_{t_i}(m_i)=1$ $i=1,2$

Oczekiwana użyteczność odbiornika od dla lub wynosi 1,5. Oczekiwana użyteczność od jest nieco powyżej 1,5, biorąc uwagę . Tak więc oczekiwana wypłata ex ante jest wyższa niż , lepsza niż czysta równowaga opisana powyżej. Co więcej, ten rozdział utrzymuje się tylko przez mieszanie. Każda inna czysta strategia przyjęta przez odbiorcę spowoduje pulę nadawców, co oznacza, że jedyną czystą strategią równowagi jest sytuacja, gdy odbiorca wybiera . $m_1$ $a$ $r$ $m_2$ $a$ $\frac{3}{2}-\epsilon$ $r$

I powinny mieć s na obrazku poniżej, dla lewej wypłat strona nadawcy do . Myślę, że jest kluczowym składnikiem. $\beta$ $a$ $\beta<1$

wprowadź opis zdjęcia tutaj

Pburg
źródło

Myślę, że to nie może się zdarzyć z awersją do ryzyka, ryzyko nadawców neutralnym odbiornika i wystarczająco bogaty. $A$

Na przykład, aby trzymać się kanonicznego modelu sygnalizacji, załóżmy, że jest dodatnią rzeczywistą linią, a użyteczność nadawców wzrasta w momencie, a użyteczność odbiornika ma liniową użyteczność w . $A$ $u$ $a$ $a$

(Trzeba przyznać, że jest to tylko częściowa odpowiedź, ponieważ ramy są znacznie mniej ogólne niż te zawarte w pytaniu, więc może nie być dla Ciebie zadowalające. W dalszym ciągu przedstawiam argument, jeśli zgadzasz się z tymi założeniami)

Aby wyprowadzić sprzeczność, załóżmy, że w równowagowej i w przypadku niektórych . Pozwolić $\sigma^m_R(a') > 0$ $\sigma^m_R(a'') > 0$ $a' \neq a'' \in A$

a^{‴} \equiv \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{'} + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{″} .

$a''' \equiv \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } a' + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } a''.$

Przez awersję do ryzyka

u [a^{‴}] > \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{'}) + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{″}) .

$u[ a''' ] > \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a') + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a'').$

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{‴}) > σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a''' ) > \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Przy pewnym założeniu ciągłości muszą istnieć również

a^{⁗} < a^{‴}

$a '''' < a'''$

takie, że

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{⁗}) = σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a'''' ) = \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Rozważmy więc skonstruowany w następujący sposób $\sigma^m_R{'}$

$\sigma^m_R{'}(a') = \sigma^m_R{'}(a'') = 0$ ,
$\sigma^m_R{'}(a'''') = \sigma^m_R(a'''') + [\sigma^m_R(a') + \sigma^m_R(a'')]$
Dla wszystkich innych , $\tilde{a}$ $\sigma^m_R{'}(\tilde{a}) = \sigma^m_R(\tilde{a})$

Odbiorcy wolą niż jeśli nie zmieniają sygnałów wysyłanych przez nadawców, ponieważ wiąże się to z mniejszymi oczekiwanymi kompensacjami. Ale z nadawcy są obojętni między i , więc powinni wysyłać te same sygnały, co w . Zatem nie może być równowagą, która pokazuje, że nie możemy mieć dwóch różnych akcji granych z prawdopodobieństwem dodatnim w równowadze. $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R$ $\sigma^m_R$

Martin Van der Linden
źródło

Czy w tym modelu odbiornik nie zawsze po prostu wybiera ?

a = 0

$a=0$

Pburg

Niekoniecznie tak jest. Jeśli odbiornik zawsze wybiera bez względu na sygnał, nie zachęca „wysokich” typów do ujawnienia ich typu poprzez „wyższy” sygnał. Może to być optymalne w równowadze sumującej, ale nie w równowadze oddzielającej. Patrz na przykład sekcja 13.C Mas-Colell, Whinston i Green, chociaż konfiguracja znów jest nieco inna niż twoja (np. Dwie firmy rywalizują o pracowników różnych typów)

a

$a$

Martin Van der Linden

Co zatem oznacza „odbiornik ma użyteczność liniową zmniejszającą się w”?

Pburg

Przepraszam, to nie było bardzo jasne. W modelu sygnalizacji Spence, który mam na myśli, działanie, które podejmuje odbiorca, polega na wypłaceniu nadawcy pensji. Narzędzie odbiorcy zależy od typu nadawcy t minus płaca płacona t − w. Zasadniczo odbiorca jest neutralny pod względem ryzyka: zależy jej tylko na oczekiwanym wynagrodzeniu, które będzie musiała zapłacić, oraz na oczekiwanym typie zatrudnienia.

Martin Van der Linden

Okej, przypuszczam, że widziałem to jako kwadratową stratę,Dzięki za sugestię, choć szukam czegoś bardziej ogólnego, ale z dyskretnymi działaniami.

- (t - w)^{2} .

$-(t-w)^2.$

Pburg