Oczekiwana wartość rozkładu jest średnią, to znaczy średnią ważoną E [ x ] = ∫ + ∞ - ∞ x
Najbardziej prawdopodobną wartością jest tryb, czyli najbardziej prawdopodobna wartość.
Czy jednak spodziewamy się, że jakoś zobaczymy wiele razy? Cytowanie stąd :
Jeżeli wyniki nie są jednakowo prawdopodobne, wówczas zwykłą średnią należy zastąpić średnią ważoną, która uwzględnia fakt, że niektóre wyniki są bardziej prawdopodobne niż inne. Intuicja pozostaje jednak taka sama: oczekiwana wartość x jest tym, czego oczekuje się średnio .x
Nie rozumiem, co oznacza „zdarza się średnio”, czy to oznacza, że biorąc pod uwagę wiele czasu, spodziewam się zobaczyć bardziej niż inne wartości ? Ale czy to nie jest definicja trybu?
Jak interpretować to stwierdzenie? A jakie jest probabilistyczne znaczenie ?
Chciałbym również pokazać przykład, w którym się mylę. Studiując Nauczyłem się, że tryb to , zaś , gdzie to stopnie swobody danych.χ 2 m o d e = ν - 2 E [ χ 2 ] = ν ν
Słyszałem na uniwersytecie, że wykonując test po zastosowaniu metody najmniejszych kwadratów w celu dopasowania zestawu danych, powinienem oczekiwać, że otrzymam ponieważ „tak się dzieje w ogóle”.χ 2 ≈ ν
Czy źle to wszystko zrozumiałem, czy też oczekiwana wartość jest jakoś bardzo prawdopodobna? (Nawet jeśli najbardziej prawdopodobną wartością jest oczywiście tryb)
Odpowiedzi:
W przypadku rozkładu normalnego oczekiwana wartość, czyli średnia, jest równa trybowi.
Ogólnie rzecz biorąc, oczekiwana wartość nie tylko nie jest najbardziej prawdopodobna (lub przy najwyższej gęstości), ale może nie mieć szansy na wystąpienie. Weźmy na przykład zmienną losową X, która wynosi 0 lub 2, każda z prawdopodobieństwem 0,5. Wtedy EX = 1, ale oczekiwana wartość 1 ma 0 prawdopodobieństwa wystąpienia, podczas gdy 0 i 2 to oba tryby rozkładu.
Cytat „oczekiwana wartość x jest tym, czego się spodziewa się średnio” jest nietechnicznym językiem laika, który, jak widać w twoim pomieszaniu, służy jedynie pomieszaniu spraw. Oczekiwana wartość ma bardzo konkretne znaczenie jako prawdopodobieństwo, że jest średnią matematyczną. Podczas gdy w języku laika oczekiwana wartość lub „średnio” może być czymś, co zwykle występuje. Można je pogodzić, jeśli „średnio” jest interpretowane jako średnia matematyczna tego, co się dzieje.
Oczekuje twój,
Joe Average
źródło
Oczekiwana wartość jest z góry bardzo abstrakcyjna i nie ma powodu sądzić, że jest to najbardziej prawdopodobny wynik; jak zauważyli inni, łatwo jest skonstruować zmienne losowe, dla których (i to samo z gęstością, jeśli jest kontynuacją)X
Jedynym uzasadnieniem oczekiwanej wartości i powodem, dla którego „spodziewamy się jej często”, jest prawo wielkich liczb :
jeśli masz niezależnych identycznie rozmieszczonych zmiennych , toX in Xi
(dla odpowiedniego znaczenia którego w tej chwili nie ma sensu badać)→
Co to znaczy? Wyobraź sobie, że rzucasz monetą z prawdopodobieństwem głowicy lądującej, które będziemy kojarzyć z liczbą i prawdopodobieństwem lądującego ogona (to znaczy ). Jaki jest najbardziej prawdopodobny wynik? 1! (to znaczy głowa) Jaka jest oczekiwana wartość?p>12 1 1−p 0
Teraz wyraźnie „p” nigdy się nie wydarzy (jest to głowa lub ogon, 0 lub 1).
Ale wypuść monetę 10.000 razy i zapisz czasy, w których się pojawiła, ponad całkowitą liczbę rzutów. Liczba ta odzwierciedla to, co intuicyjnie myślimy o średniej („średnia liczba głów”). A prawo wielkich liczb mówi ci, że liczba ta będzie bliskaE(X)=p
źródło
Nie podoba mi się termin „wartość oczekiwana” i nie użyłem go podczas nauczania prawdopodobieństwa. „Średnia arytmetyczna” jest, moim zdaniem, lepsza, ponieważ średnia arytmetyczna dla sześciościennej matrycy wynosi 3,5, ale taka liczba nie występuje. Na studiach początkowo słyszałem pojęcie „wartość oczekiwana” dla tej koncepcji. Wiele terminów technicznych nie zgadza się z oczywistym nietechnicznym znaczeniem. („Przychodzi mi na myśl”.)
Zauważ, że rozkład może mieć więcej niż jeden tryb, ale średnia arytmetyczna jest unikalna. Tryb, średnia i mediana są różne i mają różne zastosowania.
źródło
Różnicę najłatwiej dostrzec w przypadku dystrybucji dyskretnych:
Rozważ dwa zestawy wartości, w których każda liczba będzie równie narysowana: {1,2,2,2,10} i {1,2,2,2,3}.
Oba mają ten sam tryb (2), ale oczekiwane wartości różnią się. Oczekiwana wartość kładzie dodatkowy nacisk na duże wartości, podczas gdy tryb po prostu sprawdza, która wartość występuje często. Więc jeśli wyciągnąłeś z tego rozkładu kilka razy, twoja średnia próbki byłaby zbliżona do wartości oczekiwanej, podczas gdy najczęstszą liczbą całkowitą występującą byłaby wartość zbliżona do trybu.
Tryb jest zdefiniowany jako podczas gdy, jak pokazano powyżej, oczekiwana wartość jest całkowana z więc uwzględnia wagę każdego x.mode=argmaxf(x) x∗f(x)
Użycie języka do rozróżnienia różnych miar tendencji centralnej jest częstym problemem podczas uczenia się statystyki. Na przykład mediana jest kolejną miarą, która nie jest wypaczona przez duże wartości, takie jak średnia.
źródło