Wartość oczekiwana a najbardziej prawdopodobna wartość (tryb)

15

Oczekiwana wartość rozkładu jest średnią, to znaczy średnią ważoną E [ x ] = + - xf(x)

E[x]=+xf(x)dx

Najbardziej prawdopodobną wartością jest tryb, czyli najbardziej prawdopodobna wartość.

Czy jednak spodziewamy się, że jakoś zobaczymy wiele razy? Cytowanie stąd :E[x]

Jeżeli wyniki nie są jednakowo prawdopodobne, wówczas zwykłą średnią należy zastąpić średnią ważoną, która uwzględnia fakt, że niektóre wyniki są bardziej prawdopodobne niż inne. Intuicja pozostaje jednak taka sama: oczekiwana wartość x jest tym, czego oczekuje się średnio .xxix

Nie rozumiem, co oznacza „zdarza się średnio”, czy to oznacza, że ​​biorąc pod uwagę wiele czasu, spodziewam się zobaczyć E[x] bardziej niż inne wartości x ? Ale czy to nie jest definicja trybu?

Jak interpretować to stwierdzenie? A jakie jest probabilistyczne znaczenie E[x] ?


Chciałbym również pokazać przykład, w którym się mylę. Studiując Nauczyłem się, że tryb to , zaś , gdzie to stopnie swobody danych.χ 2 m o d e = ν - 2 E [ χ 2 ] = ν νχ2χmode2=ν2E[χ2]=νν

Słyszałem na uniwersytecie, że wykonując test po zastosowaniu metody najmniejszych kwadratów w celu dopasowania zestawu danych, powinienem oczekiwać, że otrzymam ponieważ „tak się dzieje w ogóle”.χ 2νχ2χ2ν


Czy źle to wszystko zrozumiałem, czy też oczekiwana wartość jest jakoś bardzo prawdopodobna? (Nawet jeśli najbardziej prawdopodobną wartością jest oczywiście tryb)

Sørën
źródło
4
Naprawdę podoba mi się moc metafory biletów w pudełku dla tego pytania, ponieważ daje ona prostą, jasną odpowiedź: oczekiwanie zmiennej losowej jest sumą jej wartości (przedstawionych na biletach) podzieloną przez liczba biletów. Otóż ​​to. Wszelkie stwierdzenia, które nie wynikają z tej definicji (lub jej bardziej wyrafinowanych matematycznych odpowiedników), są po prostu heurystyczne i mogą w niektórych okolicznościach być bardzo niepoprawne.
whuber

Odpowiedzi:

18

W przypadku rozkładu normalnego oczekiwana wartość, czyli średnia, jest równa trybowi.

Ogólnie rzecz biorąc, oczekiwana wartość nie tylko nie jest najbardziej prawdopodobna (lub przy najwyższej gęstości), ale może nie mieć szansy na wystąpienie. Weźmy na przykład zmienną losową X, która wynosi 0 lub 2, każda z prawdopodobieństwem 0,5. Wtedy EX = 1, ale oczekiwana wartość 1 ma 0 prawdopodobieństwa wystąpienia, podczas gdy 0 i 2 to oba tryby rozkładu.

Cytat „oczekiwana wartość x jest tym, czego się spodziewa się średnio” jest nietechnicznym językiem laika, który, jak widać w twoim pomieszaniu, służy jedynie pomieszaniu spraw. Oczekiwana wartość ma bardzo konkretne znaczenie jako prawdopodobieństwo, że jest średnią matematyczną. Podczas gdy w języku laika oczekiwana wartość lub „średnio” może być czymś, co zwykle występuje. Można je pogodzić, jeśli „średnio” jest interpretowane jako średnia matematyczna tego, co się dzieje.

Oczekuje twój,

Joe Average

Mark L. Stone
źródło
1
Nasuwa się pytanie: co z medianą, która z pewnością jest możliwa ?
jasna gwiazda
Jak powiedział @TrevorAlexander, tryb również nie daje gwarancji. Rozważ tryb ciągłej dystrybucji.
Tim
3
@ Trevor Alexander Zawsze istnieje mediana, która jest możliwa (prawdopodobieństwo dodatnie lub gęstość). Jednak nie wszystkie mediany są koniecznie możliwe. Mediana zmiennej losowej X to dowolny punkt m, dla którego i . Jeśli X jest równy 1,2,3 lub 4, każdy z prawdopodobieństwem 1/4, to dowolna liczba w przedziale [2,3] jest medianą X.P ( X m ) 1 / 2P(Xm)1/2P(Xm)1/2
Mark L. Stone
5

Oczekiwana wartość jest z góry bardzo abstrakcyjna i nie ma powodu sądzić, że jest to najbardziej prawdopodobny wynik; jak zauważyli inni, łatwo jest skonstruować zmienne losowe, dla których (i to samo z gęstością, jeśli jest kontynuacją)X

P(X=E(X))=0
X

Jedynym uzasadnieniem oczekiwanej wartości i powodem, dla którego „spodziewamy się jej często”, jest prawo wielkich liczb :

jeśli masz niezależnych identycznie rozmieszczonych zmiennych , toX inXi

X1++XnnE(X)

(dla odpowiedniego znaczenia którego w tej chwili nie ma sensu badać)

Co to znaczy? Wyobraź sobie, że rzucasz monetą z prawdopodobieństwem głowicy lądującej, które będziemy kojarzyć z liczbą i prawdopodobieństwem lądującego ogona (to znaczy ). Jaki jest najbardziej prawdopodobny wynik? 1! (to znaczy głowa) Jaka jest oczekiwana wartość? p>1211p0

E(X)=1p+0(1p)=p

Teraz wyraźnie „p” nigdy się nie wydarzy (jest to głowa lub ogon, 0 lub 1).

Ale wypuść monetę 10.000 razy i zapisz czasy, w których się pojawiła, ponad całkowitą liczbę rzutów. Liczba ta odzwierciedla to, co intuicyjnie myślimy o średniej („średnia liczba głów”). A prawo wielkich liczb mówi ci, że liczba ta będzie bliskaE(X)=p

Mrówka
źródło
Nie powiedziałbym, że prawo wielkich liczb jest jedynym uzasadnieniem oczekiwanej wartości. Na przykład en.wikipedia.org/wiki/… jest uzasadnieniem dla rozważenia oczekiwanych wartości funkcji narzędziowych (nie zbadałem dowodu, ale jestem zaskoczony, jeśli jest on w jakiś sposób oparty na prawie wielkich liczb).
Juho Kokkala,
3

Nie podoba mi się termin „wartość oczekiwana” i nie użyłem go podczas nauczania prawdopodobieństwa. „Średnia arytmetyczna” jest, moim zdaniem, lepsza, ponieważ średnia arytmetyczna dla sześciościennej matrycy wynosi 3,5, ale taka liczba nie występuje. Na studiach początkowo słyszałem pojęcie „wartość oczekiwana” dla tej koncepcji. Wiele terminów technicznych nie zgadza się z oczywistym nietechnicznym znaczeniem. („Przychodzi mi na myśl”.)

Zauważ, że rozkład może mieć więcej niż jeden tryb, ale średnia arytmetyczna jest unikalna. Tryb, średnia i mediana są różne i mają różne zastosowania.

ttw
źródło
1
Fajny na „lub”. To sprawiło, że pomyślałem o moim kursie programowania liniowego, w którym studiowaliśmy kilka Twierdzeń Alternatywy. Miały postać „Albo A jest prawdą, albo B jest prawdą, ale nie oba”. O wiele łatwiej jest wyrazić to jako A xor B. Nie słyszę często o używaniu Xor w swobodnej rozmowie ulicznej.
Mark L. Stone,
2

Różnicę najłatwiej dostrzec w przypadku dystrybucji dyskretnych:

Rozważ dwa zestawy wartości, w których każda liczba będzie równie narysowana: {1,2,2,2,10} i {1,2,2,2,3}.

Oba mają ten sam tryb (2), ale oczekiwane wartości różnią się. Oczekiwana wartość kładzie dodatkowy nacisk na duże wartości, podczas gdy tryb po prostu sprawdza, która wartość występuje często. Więc jeśli wyciągnąłeś z tego rozkładu kilka razy, twoja średnia próbki byłaby zbliżona do wartości oczekiwanej, podczas gdy najczęstszą liczbą całkowitą występującą byłaby wartość zbliżona do trybu.

Tryb jest zdefiniowany jako podczas gdy, jak pokazano powyżej, oczekiwana wartość jest całkowana z więc uwzględnia wagę każdego x.mode=argmaxf(x)xf(x)

Użycie języka do rozróżnienia różnych miar tendencji centralnej jest częstym problemem podczas uczenia się statystyki. Na przykład mediana jest kolejną miarą, która nie jest wypaczona przez duże wartości, takie jak średnia.

VCG
źródło