Nieformalnie rozkład prawdopodobieństwa określa względną częstotliwość wyników zmiennej losowej - oczekiwaną wartość można traktować jako średnią ważoną tych wyników (ważoną częstotliwością względną). Podobnie oczekiwaną wartość można traktować jako średnią arytmetyczną zbioru liczb wygenerowanych dokładnie proporcjonalnie do ich prawdopodobieństwa wystąpienia (w przypadku ciągłej zmiennej losowej nie jest to do końca prawdą, ponieważ określone wartości mają prawdopodobieństwo ).0
Związek między wartością oczekiwaną a średnią arytmetyczną jest najbardziej wyraźny w przypadku dyskretnej zmiennej losowej, gdzie wartość oczekiwana wynosi
mi( X) = ∑S.x P.( X= x )
gdzie jest przestrzenią próbki. Na przykład załóżmy, że masz dyskretną losową zmienną taką, że:XS.X
X= ⎧⎩⎨12)3)z prawdopodobieństwem 1 / 8z prawdopodobieństwem 3 / 8z prawdopodobieństwem 1 / 2
Oznacza to, że funkcja masy prawdopodobieństwa wynosi , , a . Korzystając z powyższego wzoru, oczekiwaną wartością jestp ( X = 2 ) = 3 / 8 p ( X = 3 ) = 1 / 2P.( X= 1 ) = 1 / 8P.( X= 2 ) = 3 / 8P.( X= 3 ) = 1 / 2
mi( X) = 1 ⋅ ( 1 / 8 ) + 2 ⋅ ( 3 / 8 ) + 3 ⋅ ( 1 / 2 ) = 2.375
Rozważmy teraz liczby generowane z częstotliwościami dokładnie proporcjonalnymi do funkcji masy prawdopodobieństwa - na przykład zbiór liczb - dwa s, sześć si osiem s. Teraz weź średnią arytmetyczną tych liczb:{ 1 , 1 , 2 , 2 , 2 , 2 , 2 , 2 , 3 , 3 , 3 , 3 , 3 , 3 , 3 , 3 }123
1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375
i widać, że jest dokładnie równa oczekiwanej wartości.
Oczekiwanie to średnia wartość lub średnia zmiennej losowej, a nie rozkład prawdopodobieństwa. Jako taki jest dla dyskretnych zmiennych losowych średnią ważoną wartości, które przyjmuje zmienna losowa, jeżeli ważenie jest zgodne ze względną częstotliwością występowania tych poszczególnych wartości. W przypadku absolutnie ciągłej zmiennej losowej jest to całka wartości x pomnożona przez gęstość prawdopodobieństwa. Obserwowane dane można przeglądać jako wartości zbioru niezależnych identycznie rozmieszczonych zmiennych losowych. Średnia próbki (lub oczekiwana próbka) jest zdefiniowana jako oczekiwanie danych w odniesieniu do rozkładu empirycznego dla obserwowanych danych. To sprawia, że jest to po prostu średnia arytmetyczna danych.
źródło
Zwróćmy szczególną uwagę na definicje:
Średnia jest definiowana jako suma zbioru liczb podzielona przez liczbę liczb w zbiorze. Obliczenia byłyby następujące: „dla i w 1 do n, (suma x sub i) podzielone przez n”.
Wartość oczekiwana (EV) to długoterminowa średnia wartość powtórzeń eksperymentu, który reprezentuje. Obliczenia byłyby następujące: „dla i w 1 do n, suma zdarzenia x sub i razy jego prawdopodobieństwo (i suma wszystkich p sub i musi = 1)”.
W przypadku rzetelnej kości łatwo zauważyć, że średnia i EV są takie same. Średnia - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5, a EV wynosi:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = suma (p * x) = 3,50
Ale co, jeśli kostka nie byłaby „sprawiedliwa”. Łatwym sposobem na wykonanie niesprawiedliwej kości byłoby wywiercenie dziury w rogu na przecięciu powierzchni 4, 5 i 6. Dalej, powiedzmy teraz, że prawdopodobieństwo rzutu 4, 5 lub 6 na naszej nowej i ulepszonej krzywej matrycy wynosi teraz .2, a prawdopodobieństwo rzutu 1, 2 lub 3 wynosi teraz .133. Jest to ta sama kość z 6 twarzami, po jednym numerze na każdej twarzy, a średnia dla tej kości wciąż wynosi 3,5. Jednak po wielokrotnym rzucie tą kością nasz EV ma teraz 3,8, ponieważ prawdopodobieństwa zdarzeń nie są już takie same dla wszystkich zdarzeń.
prob xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = suma (p * x) = 3,80
Ponownie, bądźmy ostrożni i wróćmy do definicji, zanim stwierdzimy, że jedna rzecz zawsze będzie „taka sama” jak inna. Zobacz, jak ustawia się normalną kostkę i wywierć dziurę w pozostałych 7 rogach i zobacz, jak zmieniają się EV - baw się dobrze.
Bob_T
źródło
Jedyna różnica między „średnią” a „wartością oczekiwaną” polega na tym, że średnia jest używana głównie do rozkładu częstotliwości, a oczekiwanie jest wykorzystywane do rozkładu prawdopodobieństwa. W rozkładzie częstotliwości przestrzeń próbki składa się ze zmiennych i ich częstotliwości występowania. W rozkładzie prawdopodobieństwa przestrzeń próbki składa się ze zmiennych losowych i ich prawdopodobieństw. Teraz wiemy, że całkowite prawdopodobieństwo wszystkich zmiennych w przestrzeni próbki musi wynosić = 1. Na tym polega podstawowa różnica. Termin mianownika dla oczekiwań wynosi zawsze = 1. (tj. Podsumowanie f (xi) = 1) Jednak nie ma takich ograniczeń dotyczących sumowania częstotliwości (która jest w zasadzie całkowitą liczbą wpisów).
źródło