Istnieją dwie koperty. Jeden zawiera pieniędzy, a drugi zawiera ilość pieniędzy. Dokładna ilość „ ” nie jest mi znana, ale znam powyższe. Wybieram jedną kopertę i otwieram. Widzę w nim pieniądze, oczywiście gdzie .
Teraz zaproponowano mi zachowanie lub zmianę kopert.
Oczekiwana wartość przełączenia to . Oczekiwana wartość utrzymania mojej koperty wynosi .
Wydaje się, że zawsze powinienem zmieniać koperty. Moje dwa pytania:
Czy to rozumowanie jest prawidłowe?
Jest to inaczej, jeśli nie wolno mi, aby otworzyć kopertę i zobaczyć ilość pieniędzy, a potem mam możliwość, aby przełączyć się w nieskończoność?
microeconomics
expected-utility
Kawaleria Kitsune
źródło
źródło
Odpowiedzi:
Oto podejście oparte na „oczekiwanej maksymalizacji użyteczności / teorii gier” (z odrobiną prawdopodobieństwa set-teoretycznego). W takich ramach odpowiedzi wydają się jasne.
LOKAL
Powiedziano nam z absolutną uczciwością, że dla ściśle dodatniej kwoty pieniężnej dwa następujące bilety zostały umieszczone w pudełku: z przypisanym numerem identyfikacyjnym i z przypisanym numerem identyfikacyjnymx {A=x,B=2x} 1 {A=2x,B=x} 0 . Następnie czerpać z Bernoulliego zmiennej losowej został wykonany, oraz w oparciu o wynik i zdarzenia, które wystąpiło kwoty i umieszczano w kopertach i . Nie powiedziano nam, jaka jest wartość ani jaka kwota trafiła do której koperty.(p=0.5) x 2x A B x
Pierwszy przypadek: wybierz kopertę z opcją przełączania bez otwierania
Pierwszą kwestią jest to, jak wybrać kopertę ? Ma to związek z preferencjami. Załóżmy więc , że oczekujemy maksymalizatorów użyteczności z funkcją użyteczności .u()
Możemy tutaj modelować strukturę probabilistyczną, biorąc pod uwagę dwie dychotomiczne zmienne losowe, i reprezentujące obwiednie oraz ich ilość. Obsługa każdego z nich to . Ale nie są niezależni. Musimy więc zacząć od wspólnej dystrybucji. W postaci tabeli łączny rozkład i odpowiadające mu rozkłady krańcowe toA B {x,2x}
To mówi nam, że i mają identyczne rozkłady krańcowe.A B
Oznacza to jednak, że nie ma znaczenia, w jaki sposób wybieramy koperty, ponieważ zawsze otrzymamy taką samą oczekiwaną użyteczność ,
Mamy tu do czynienia z hazardem złożonym (jak wybrać kopertę) nad dwoma identycznymi hazardami (każda koperta). Możemy wybrać z prawdopodobieństwemA 1 , lub dowolną wartością pośrednią (i komplementarnie dla ). To nie ma znaczenia Zawsze otrzymamy taką samą oczekiwaną użyteczność. Pamiętaj, że nasze podejście do ryzyka nie odgrywa tutaj żadnej roli.0 B
Wybieramy więc kopertę, powiedzmy , i patrzymy na nią. Jaka jest teraz nasza oczekiwana użyteczność? Dokładnie tak samo jak przed wyborem . Jakiekolwiek wybranie koperty nie wpływa na prawdopodobieństwo tego, co jest w środku.A
Możemy się zmienić. Powiedzmy, że tak, a teraz trzymamy kopertęB . Jaka jest teraz oczekiwana użyteczność? Dokładnie tak samo jak poprzednio .
Są to dla nas dwa możliwe stany świata: wybierzA lub wybierz . Niezależnie od wyboru, oba stany świata oznaczają tę samą wartość dla naszej wybranej / zakładanej siły napędowej (tj. Maksymalizują oczekiwaną użyteczność).B
Więc tutaj jesteśmy obojętni na zamianę. , a tak naprawdę moglibyśmy również losowo.
2. PRZYPADEK: OTWARCIE KOPERTY z opcją przełączania po
Załóżmy teraz, że wybraliśmy , otworzyliśmy go i znaleźliśmy wewnątrz kwotyA y∈{x,2x} . Czy to coś zmienia?
Zobaczmy. Zastanawiam się co jest
Cóż, to przestrzeń próbki, na której zdefiniowana jest zmienna losowaUwarunkowanie całej przestrzeni próbki, tj. Trywialnej sigma-algebry, nie wpływa ani na prawdopodobieństwa, ani na oczekiwane wartości. To tak, jakbyśmy się zastanawiali „jaka jest wartość jeśli wiemy, że wszystkie możliwe wartości mogły zostać zrealizowane?” Nie uzyskano żadnej skutecznej wiedzy, dlatego wciąż jesteśmy w oryginalnej strukturze probabilistycznej.{x,2x} A A
Ale zastanawiam się też, co to jest
Instrukcja warunkowa, poprawnie postrzegana jako sigma-algebra wygenerowana przez zdarzenie , jest całą przestrzenią próbki produktu, na której losowy wektor został zdefiniowany. Z powyższej tabeli rozkładu połączeń widzimy, że alokacja prawdopodobieństwa alokacji jest równoważna alokacji prawdopodobieństwa marginesów (kwalifikacja „prawie na pewno” ze względu na obecność dwóch zdarzeń o wartości zero). Więc tutaj również zasadniczo warunkujemy prawdopodobieństwa dla całej przestrzeni próbki. Wynika z tego, że nasze działanie mające na celu otwarcie koperty nie wpłynęło na strukturę probabilistyczną dla{A∈{x,2x}} (A,B) B B również.
Wprowadź teorię gry wraz z podejmowaniem decyzji. Otworzyliśmy kopertę i musimy zdecydować, czy zmienimy, czy nie. Jeśli się nie przełączymy, otrzymamy narzędzieu(y) . Jeśli zmienimy się, będziemy w następujących dwóch możliwych stanach świata
Nie wiemy, który stan faktycznie się utrzymuje, ale z powyższej dyskusji wiemy, że każde ma prawdopodobieństwop=0.5 istnienia.
Możemy to modelować jako grę, w której naszym przeciwnikiem jest „natura” i gdzie wiemy, że natura gra z pewnością losową strategią : przy a przy ,p=0.5 y=x p=0.5 y=2x . Ale my także teraz, że jeśli się nie zmienimy, nasza wypłata jest pewna. Oto nasza gra w normalnej formie z naszymi wypłatami:
Należy pokusę zastąpić i do . to znana i pewna wypłata. Korzyści ze strategii „Switch” nie są tak naprawdę znane (ponieważ nie znamy wartości ). Powinniśmy więc odwrócić podstawienie . Jeśli to , a jeśli tou(x) u(2x) u(y) u(y) x y=x u(2x)=u(2y) y=2x u(x)=u(y/2) . Oto nasza gra ponownie:
Teraz wszystkie wypłaty w macierzy są znane. Czy istnieje strategia dominująca?
Oczekiwana wypłata strategii „Switch” to
Oczekiwany zwrot strategii „Don't Switch” to
Powinniśmy zmienić jeśli
A teraz stosunek do ryzyka staje się krytyczny. Nietrudno jest wydedukować, że przy zachowaniu ryzyka i neutralnym ryzyku powinniśmy zmienić.
Jeśli chodzi o zachowanie zapobiegające ryzyku , znajduję elegancki rezultat:
W przypadku „mniej wklęsłych” (ściśle powyżej) funkcji narzędziowych niż logarytmicznych (powiedzmy pierwiastek kwadratowy), powinniśmy nadal Przełączać.
Dla narzędzia logarytmicznegou(y)=lny , jesteśmy obojętni między zmianą lub nie.
Za „niż” bardziej wklęsła (ściśle poniżej) logarytmicznych funkcji użytkowych, powinniśmy nie przełącznika.
Zamykam schematem przypadku logarytmicznego
Założyćy=4 . Następniey/2=2,2y=8 . Linia to linia, na której spoczywa oczekiwana użyteczność z „Switcha”. Ponieważ natura odgrywa strategię , faktycznie będzie w punkcie , który jest środkowym punktem . W tym momencie z narzędziem logarytmicznym otrzymujemy dokładnie to samo narzędzie z „Don't Switch”, czyli dla tego przykładu liczbowego.Γ−Δ−E 50−50 Δ Γ−Δ−E ln(4)
źródło
Jeśli otworzysz obwiednię E1 i zobaczysz, że jej wartość to E1 = Y , to prawdą jest, że wartość drugiej obwiedni E2 jest w {E2 = Y / 2, E2 = 2Y} .
Prawdą jest również, że oczekiwana wartość tej obwiedni wynosi (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .
Błąd zakłada, że Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 niezależnie od tego, co to jest Y. Uproszczonym sposobem na wykazanie tego jest założenie, że każda koperta zawiera amerykańskie pieniądze papierowe o różnych nominałach. Jeśli Y = 1 USD , E2 nie może być Y / 2 .
Bardziej rygorystyczny dowód jest zbyt szczegółowy, aby go tu podać, ale jego podsumowaniem jest najpierw założenie, że dla dowolnej wartości Z , że Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Jest to zasadniczo to samo założenie, co w poprzednim akapicie, rozszerzone na zakres wartości. Ale jeśli jest to prawdą dla dowolnej wartości Z , oznacza to, że Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) jest stały dla każdej wartości N , od -inf do inf. Ponieważ jest to niemożliwe, założenie nie może być prawidłowe.
+++++
To mogło być trochę mylące, więc pozwól mi spróbować. Dostajesz dwa zestawy dwóch kopert. W jednym zestawie zawierają 10 i 20 dolarów. W drugim zawierają 20 i 40. Ty wybierasz zestaw, a następnie otwierasz jedną kopertę w tym zestawie, aby znaleźć 20. Następnie masz szansę na przejście do drugiej koperty w tym zestawie. Powinieneś?
Tak, powinien się zmienić. Oczekiwany zysk po przełączeniu na drugą obwiednię wynosi [(20-10) + (20-40)] / 2 = +5.
Zauważ, że ten przypadek - to znaczy wiedząc, że znalazłeś 20, a nie 10 lub 40, odpowiada warunkom opisanym w pytaniu. Twoje rozwiązanie działa. Ale sam eksperyment nie pasuje do tego opisu. Jeśli znalazłeś 10 lub 40, prawdopodobieństwo, że inna koperta ma 20, wynosi 100%. Oczekiwane zyski wynoszą odpowiednio +10 i -20. A jeśli uśrednisz trzy możliwe zyski ponad prawdopodobieństwa, otrzymasz trzy wartości, otrzymasz 10/4 + 5/2 - 20/4 = 0.
źródło
Ogólnie problem jest nierozwiązywalny, ponieważ nie określono procedury randomizacji dla całego eksperymentu.
Ale niech Y będzie wartością wybranej koperty, a X drugą kopertą. Odpowiedź brzmi zatemE[X|Y=y] - co jest warunkiem warunkowym . Jednak przy założeniu najbardziej ogólnego rozkładu Y, Y jest równomiernie rysowane ze wszystkichR . Ale wtedyPr(Y=y)=0 , a przez paradoks Borela – Kołmogorowa oczekiwanie jest nierozwiązywalne.
źródło