Załóżmy, że jest zbiorem wzajemnie wykluczających się wyników dyskretnej zmiennej losowej, a to funkcja użyteczności, w której , itd.
Gdy jest równomiernie rozłożone i jest funkcją masy prawdopodobieństwa , Shannon entropii jest zmaksymalizowane (, a gdy jeden element wma całąmasę, entropia Shannona jest zminimalizowana (w rzeczywistości). Odpowiada to intuicji na tematsurprisalu(lubzmniejszenia niepewności) oraz wyników iniepewności(lubspodziewanego surprisalu) i zmiennych losowych:
- Kiedy jest równomiernie rozmieszczone, niepewność jest zmaksymalizowana, a im więcej wyników dla równomiernego rozkładu masy, tym bardziej jesteśmy niepewni.
- Kiedy skupia całą swoją masę w jednym wyniku, nie mamy niepewności.
- Kiedy przypisujemy wynikowi prawdopodobieństwo , nie otrzymujemy żadnych informacji („jesteśmy zaskoczeni”), kiedy faktycznie je obserwujemy.
- Kiedy przypisujemy wynikowi prawdopodobieństwo coraz bliższe , obserwacja jego faktycznego występowania staje się coraz bardziej pouczająca („zaskakująca”).
(To wszystko nie mówi nic o znacznie bardziej konkretnej - ale mniej epistemicznej - kodującej interpretacji informacji / entropii Shannona.)
Jednakże, gdy ma interpretację funkcji użytkowych , istnieje sensical interpretacja lub∑f(ω)log1 ? Wydaje mi się, że mogą istnieć:
- jeśli jako PMF reprezentuje równomierny rozkład na Ω , to f jako funkcja użyteczności odpowiada obojętności na wyniki, która nie może być większa *
- funkcja użyteczności, w której jeden wynik ma całą użyteczność, a reszta nie ma żadnej (tak wypaczonej użyteczności, jak to możliwe), odpowiada bardzo silnym preferencjom względnym - brakowi obojętności.
Czy rozwija się odniesienie do tego? Czy coś przeoczyłem na temat ograniczeń porównywania funkcji masy prawdopodobieństwa i znormalizowanych narzędzi względnych względem dyskretnych zmiennych losowych?
* Zdaję sobie sprawę z krzywych obojętności i nie widzę, w jaki sposób mogą one być odpowiednie dla mojego pytania z różnych powodów, poczynając od skupienia się na kategorycznej przestrzeni próbki i na tym, że nie jestem zainteresowany „obojętnością” per se, ale raczej jak interpretować narzędzia jako prawdopodobieństwa i jak interpretować funkcjonały na prawdopodobieństwach, gdy (dyskretny) „rozkład prawdopodobieństwa”, o którym mowa, faktycznie lub (dodatkowo) ma interpretację funkcji użyteczności.
Odpowiedzi:
Przed dyskusją Entropia Shannona należy omówić jeszcze jedną kwestię: wydaje się, że masz na myśli raczej kardynalną użyteczność niż porządek .
W obu przypadkach można oczywiście wyprowadzić „znormalizowane” funkcje narzędziowe. Ale pojęcie „względnej preferencji” można zdefiniować i zmierzyć tylko w kontekście kardynalnej użyteczności.
Problem nie pojawia się w dwóch skrajnościach, które opisujesz, ale we wszystkich możliwych przypadkach pośrednich.
Prosty przykład: załóżmy, że istnieją trzy „wyniki”, (powiedzmy, poziomy konsumpcji lub trzy różne towary w określonej ilości). Twoja funkcja narzędziowa przypisała im wartościA,B,C
W zwykłej użyteczności to nam tylko to mówi
Z pewnością możemy je znormalizować dzieląc przez aby uzyskać100
a ranking trzech wyników zostaje zachowany
Ale pod zwykłą użytecznością moglibyśmy równie dobrze użyć innej funkcji użytecznej, która by to przypisała
i uzyskaj
Czy znasz problemy związane z użytecznością kardynalną?
źródło
Po wymianie z OP w mojej drugiej odpowiedzi, popracujmy trochę z jego podejściem.
i powiedziano nam to
i uzyskaliśmy ogólny wynik:
Mam jednak wrażenie, że OP nie ma na myśli tego. Przeciwnie, traktuje Entropię Shannona jako metrykę, która ma pewne pożądane właściwości algebraiczne i być może może zmierzyć zwięźle w znaczący sposób coś interesującego.
Dokonano tego wcześniej w dziedzinie ekonomii, szczególnie w organizacji przemysłowej, gdzie zbudowano wskaźniki koncentracji rynku („stopień konkurencji / monopolistyczna struktura rynku”). Zwracam uwagę na dwa, które wydają się tutaj szczególnie istotne.
Encaoua, D., i Jacquemin, A. (1980). Stopień monopolu, wskaźniki koncentracji i zagrożenie wejścia. Międzynarodowy przegląd ekonomiczny, 87–105. , zapewniają aksjomatyczne wyprowadzenie „dopuszczalnych” wskaźników stężenia, tj. określają właściwości, które taki wskaźnik musi posiadać. Ponieważ ich podejście jest abstrakcyjne, uważam, że przydatne może być to, do czego PO chce zbadać i nadać znaczenie.
źródło
W związku z tym należy najpierw podać znaczącą skalę stosunku do użyteczności. Jednym ze sposobów na to jest interpretacja naturalnego poziomu użyteczności 0. Bez tej specyfikacji entropia nie ma znaczenia.
źródło