Dlaczego oczekiwanie jest takie samo jak średnia arytmetyczna?

47

Dzisiaj natknąłem się na nowy temat zatytułowany Oczekiwanie matematyczne. Książka, którą obserwuję, mówi: oczekiwanie jest średnią arytmetyczną zmiennej losowej pochodzącej z dowolnego rozkładu prawdopodobieństwa. Ale definiuje oczekiwanie jako sumę iloczynu niektórych danych i prawdopodobieństwa ich wystąpienia. Jak te dwie wartości (średnia i oczekiwanie) mogą być takie same? W jaki sposób suma czasów prawdopodobieństwa danych może być średnią z całego rozkładu?

expected-value pranphy
źródło

51

Nieformalnie rozkład prawdopodobieństwa określa względną częstotliwość wyników zmiennej losowej - oczekiwaną wartość można traktować jako średnią ważoną tych wyników (ważoną częstotliwością względną). Podobnie oczekiwaną wartość można traktować jako średnią arytmetyczną zbioru liczb wygenerowanych dokładnie proporcjonalnie do ich prawdopodobieństwa wystąpienia (w przypadku ciągłej zmiennej losowej nie jest to do końca prawdą, ponieważ określone wartości mają prawdopodobieństwo ). $0$

Związek między wartością oczekiwaną a średnią arytmetyczną jest najbardziej wyraźny w przypadku dyskretnej zmiennej losowej, gdzie wartość oczekiwana wynosi

E (X) = \sum_{S} x P (X = x)

$E(X) = \sum_{S} x P(X=x)$

gdzie jest przestrzenią próbki. Na przykład załóżmy, że masz dyskretną losową zmienną taką, że: $S$ $X$

X = {\begin{cases} 1 & with probability 1 / 8 \\ 2 & with probability 3 / 8 \\ 3 & with probability 1 / 2 \end{cases}

$X = \begin{cases} 1 & \mbox{with probability } 1/8 \\ 2 & \mbox{with probability } 3/8 \\ 3 & \mbox{with probability } 1/2 \end{cases}$

Oznacza to, że funkcja masy prawdopodobieństwa wynosi , , a . Korzystając z powyższego wzoru, oczekiwaną wartością jest $P(X=1)=1/8$ $P(X=2)=3/8$ $P(X=3)=1/2$

E (X) = 1 \cdot (1 / 8) + 2 \cdot (3 / 8) + 3 \cdot (1 / 2) = 2.375

$E(X) = 1\cdot (1/8) + 2 \cdot (3/8) + 3 \cdot (1/2) = 2.375$

Rozważmy teraz liczby generowane z częstotliwościami dokładnie proporcjonalnymi do funkcji masy prawdopodobieństwa - na przykład zbiór liczb - dwa s, sześć si osiem s. Teraz weź średnią arytmetyczną tych liczb: $\{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3\}$ $1$ $2$ $3$

\frac{1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 + 3}{16} = 2.375

$\frac{1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+3}{16} = 2.375$

i widać, że jest dokładnie równa oczekiwanej wartości.

Makro
źródło

Czy nie można tego lepiej zilustrować za pomocą prostszego zestawu {1,2,2,2,3,3,3,3}? Wyrażenie pokazujące średnią arytmetyczną tego zbioru jest identyczne z wyrażeniem pokazującym wartość oczekiwaną tej zmiennej (jeśli przekształcisz ważone produkty w proste sumy).

Dancrumb

Re: „Wyrażenie pokazujące średnią arytmetyczną tego zbioru jest identyczne z wyrażeniem pokazującym wartość oczekiwaną tej zmiennej (jeśli przekształcisz ważone produkty w proste sumy)” - Tak @Dancrumb, to był cały punkt :)

Macro

12

Oczekiwanie to średnia wartość lub średnia zmiennej losowej, a nie rozkład prawdopodobieństwa. Jako taki jest dla dyskretnych zmiennych losowych średnią ważoną wartości, które przyjmuje zmienna losowa, jeżeli ważenie jest zgodne ze względną częstotliwością występowania tych poszczególnych wartości. W przypadku absolutnie ciągłej zmiennej losowej jest to całka wartości x pomnożona przez gęstość prawdopodobieństwa. Obserwowane dane można przeglądać jako wartości zbioru niezależnych identycznie rozmieszczonych zmiennych losowych. Średnia próbki (lub oczekiwana próbka) jest zdefiniowana jako oczekiwanie danych w odniesieniu do rozkładu empirycznego dla obserwowanych danych. To sprawia, że jest to po prostu średnia arytmetyczna danych.

Michael Chernick
źródło

2

+1. Good catch re: „Oczekiwanie to średnia wartość lub średnia zmiennej losowej, a nie rozkład prawdopodobieństwa”. Nie zauważyłem tego subtelnego niewłaściwego użycia terminologii.

Makro

4

Zwróćmy szczególną uwagę na definicje:

Średnia jest definiowana jako suma zbioru liczb podzielona przez liczbę liczb w zbiorze. Obliczenia byłyby następujące: „dla i w 1 do n, (suma x sub i) podzielone przez n”.

Wartość oczekiwana (EV) to długoterminowa średnia wartość powtórzeń eksperymentu, który reprezentuje. Obliczenia byłyby następujące: „dla i w 1 do n, suma zdarzenia x sub i razy jego prawdopodobieństwo (i suma wszystkich p sub i musi = 1)”.

W przypadku rzetelnej kości łatwo zauważyć, że średnia i EV są takie same. Średnia - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5, a EV wynosi:

prob xp * x

0,167 1 0,17

0,167 2 0,33

0,167 3 0,50

0,167 4 0,67

0,167 5 0,83

0,167 6 1,00

EV = suma (p * x) = 3,50

Ale co, jeśli kostka nie byłaby „sprawiedliwa”. Łatwym sposobem na wykonanie niesprawiedliwej kości byłoby wywiercenie dziury w rogu na przecięciu powierzchni 4, 5 i 6. Dalej, powiedzmy teraz, że prawdopodobieństwo rzutu 4, 5 lub 6 na naszej nowej i ulepszonej krzywej matrycy wynosi teraz .2, a prawdopodobieństwo rzutu 1, 2 lub 3 wynosi teraz .133. Jest to ta sama kość z 6 twarzami, po jednym numerze na każdej twarzy, a średnia dla tej kości wciąż wynosi 3,5. Jednak po wielokrotnym rzucie tą kością nasz EV ma teraz 3,8, ponieważ prawdopodobieństwa zdarzeń nie są już takie same dla wszystkich zdarzeń.

prob xp * x

0,133 1 0,13

0,133 2 0,27

0,133 3 0,40

0,200 4 0,80

0,200 5 1,00

0,200 6 1,20

EV = suma (p * x) = 3,80

Ponownie, bądźmy ostrożni i wróćmy do definicji, zanim stwierdzimy, że jedna rzecz zawsze będzie „taka sama” jak inna. Zobacz, jak ustawia się normalną kostkę i wywierć dziurę w pozostałych 7 rogach i zobacz, jak zmieniają się EV - baw się dobrze.

Bob_T

Bob_T
źródło

-1

Jedyna różnica między „średnią” a „wartością oczekiwaną” polega na tym, że średnia jest używana głównie do rozkładu częstotliwości, a oczekiwanie jest wykorzystywane do rozkładu prawdopodobieństwa. W rozkładzie częstotliwości przestrzeń próbki składa się ze zmiennych i ich częstotliwości występowania. W rozkładzie prawdopodobieństwa przestrzeń próbki składa się ze zmiennych losowych i ich prawdopodobieństw. Teraz wiemy, że całkowite prawdopodobieństwo wszystkich zmiennych w przestrzeni próbki musi wynosić = 1. Na tym polega podstawowa różnica. Termin mianownika dla oczekiwań wynosi zawsze = 1. (tj. Podsumowanie f (xi) = 1) Jednak nie ma takich ograniczeń dotyczących sumowania częstotliwości (która jest w zasadzie całkowitą liczbą wpisów).

Shruti
źródło

Dlaczego oczekiwanie jest takie samo jak średnia arytmetyczna?

Odpowiedzi: