Jak wartość oczekiwana odnosi się do średniej, mediany itp. W rozkładzie nienormalnym?

9

Jak oczekiwana wartość ciągłej zmiennej losowej odnosi się do jej średniej arytmetycznej, mediany itp. W rozkładzie nienormalnym (np. Skośno-normalnym)? Interesują mnie wszelkie popularne / interesujące dystrybucje (np. Log-normal, proste dystrybucje bi / multimodalne, wszystko inne dziwne i wspaniałe).

Szukam głównie odpowiedzi jakościowych, ale wszelkie ilościowe lub formalne odpowiedzi są również mile widziane. W szczególności chciałbym zobaczyć wszelkie wizualne reprezentacje, które to wyjaśnią.

naught101
źródło
Czy możesz być trochę jaśniejszy? Średnia arytmetyczna i mediana są funkcjami, które stosujemy do danych, a nie czymś istotnym dla poszczególnych rozkładów ... na przykład dane nie muszą być normalne, aby można było obliczyć średnią próbki.
gość
Ok, więc technicznie pytanie powinno brzmieć „w jaki sposób oczekiwana wartość odnosi się do średniej, mediany itp. Danych losowo wybranych z określonego rozkładu prawdopodobieństwa?” Szukam prostych, intuicyjnych interpretacji, podobnych do sposobu, w jaki można intuicyjnie powiedzieć, że gdy rozkład jest bardziej wypaczony, mediana i średnia są dalej od siebie, a mediana może lepiej wskazywać, gdzie znajdują się dane.
naught101
Heh Dzięki Marco. Najwyraźniej źle czytałem. Równie dobrze może napisać to jako odpowiedź, wybiorę to na najlepszą odpowiedź.
naught101

Odpowiedzi:

8

(częściowo przekonwertowany z mojego teraz usuniętego komentarza powyżej)

Oczekiwana wartość i średnia arytmetyczna są dokładnie tym samym. Mediana jest powiązana ze średnią w nietrywialny sposób, ale możesz powiedzieć kilka rzeczy na temat ich relacji:

  • gdy rozkład jest symetryczny, średnia i mediana są takie same

  • gdy rozkład jest wypaczony ujemnie, mediana jest zwykle większa niż średnia

  • gdy rozkład jest dodatnio wypaczony, mediana jest zwykle mniejsza niż średnia

Makro
źródło
Ciekawy. Jakie są przykłady niezwykłego zachowania ujemnie wypaczonego rozkładu, w którym średnia jest większa niż mediana?
naught101
@ naught101: czy to literówka? Ujemnie wypaczony rozkład to taki, w którym wyniki na lewo od centrum występują częściej niż wyniki na prawo od centrum, a zatem „ogon” wyników o niskiej częstotliwości wychodzi na prawo. W takiej sytuacji garb po lewej stronie zawsze pociągnie (arytmetyczny) środek w lewo od środka, podczas gdy ogon po prawej stronie utrzyma medianę powyżej średniej.
Assad Ebrahim
@AssadEbrahim: Nie, to było odniesienie do komentarza Makra „mediana jest zwykle większa niż średnia” - prosiłem o kontrprzykłady.
naught101
@ naught101: Kontrprzykłady w przypadku rozkładu unimodalnego to jego następna linia: kiedy garb jest w prawo, to ogon w lewo pociąga medianę poniżej średniej. Im dłuższy ogon, tym większa różnica między medianą a średnią.
Assad Ebrahim
1
Jakie są praktyczne okoliczności, w których można by zastosować medianę w stosunku do średniej lub odwrotnie? Na przykład w analizie przeżycia, w której wcielenia mają rozkład wykładniczy, czy powinienem użyć mediany (tak aby połowa rzeczy trwała dłużej, połowa trwa krócej) lub średniej („oczekiwanego” życia), gdybym musiał przewidzieć życie / śmierć jako binarne wynik?
drevicko
5

Istnieje ładna zależność między harmoniczną, geometryczną i średnią arytmetyczną logarytmicznej zmiennej losowej o rozkładzie normalnym . PozwolićXLN(μ,σ2)

  • HM(X)=eμ12σ2 (średnia harmoniczna),
  • GM(X)=eμ (średnia geometryczna),
  • AM(X)=eμ+12σ2 (średnia arytmetyczna).

Nietrudno zauważyć, że iloczyn harmonicznej i średniej arytmetycznej daje kwadrat średniej geometrycznej, tj.

HM(X)AM(X)=GM2(X).

Ponieważ wszystkie wartości są dodatnie, możemy wziąć pierwiastek kwadratowy i stwierdzić, że średnia geometryczna jest średnią geometryczną średniej harmonicznej i średniej arytmetycznejXXX , tj.

GM(X)=HM(X)AM(X).

Ponadto, dobrze znana nierówność HM-GM-AM

HM(X)GM(X)AM(X)

można wyrazić jako

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

gdzie to wariancja geometryczna.GVar(X)=eσ2

Björn Friedrich
źródło
1

Dla kompletności istnieją również rozkłady, dla których średnia nie jest dobrze zdefiniowana. Klasycznym przykładem jest rozkład Cauchy'ego ( ta odpowiedź zawiera ładne wyjaśnienie dlaczego). Innym ważnym przykładem jest rozkład Pareto z wykładnikiem mniejszym niż 2.

drevicko
źródło
1
Kilka iff. Prawo mocy nie jest rozkładem, ale rozkład Pareto jest prawem mocy. Odnosi się to do niecałkowalności funkcji mocy wypukłej log przy . Dla prawa władzy masz na myśli mniej niż 2, nie więcej niż 2.x=0
Carl
@Carl dobre punkty - odpowiednio zredagowałem odpowiedź. Wiele dzięki (:
drevicko,
0

Chociaż prawdą jest, że średnia matematyczna i wartość oczekiwana są zdefiniowane identycznie, w przypadku przekrzywionego rozkładu ta konwencja nazewnictwa wprowadza w błąd.

Wyobraź sobie, że pytasz przyjaciółkę o ceny mieszkań w jej mieście, ponieważ naprawdę Ci się tam podoba i naprawdę myślisz o przeprowadzce do tego miasta.

Jeśli podział nagród mieszkaniowych byłby niejednoznaczny i symetryczny, wtedy twój przyjaciel może ci powiedzieć średnią cenę domów i rzeczywiście możesz spodziewać się, że większość domów na rynku znajdzie się wokół tej średniej wartości.

Jeśli jednak rozkład cen mieszkań jest niejednoznaczny i przekrzywiony, na przykład skośny w prawo z większością domów w dolnym przedziale cenowym po lewej stronie i tylko niektórymi wygórowanymi domami po prawej stronie, wówczas średnia zostanie „wypaczona” do wysokich cen na prawo.

W przypadku tego niejednoznacznego, skośnego rozkładu cen domów można oczekiwać, że większość domów na rynku znajdzie się wokół mediany .

Sol Hator
źródło
1
Nie jest jasne, co masz na myśli, gdy mówisz o wypaczonych rozkładach unimodalnych, rozkład cen domów ma ceny wokół mediany. Można powiedzieć, że połowa wartości będzie równa lub niższa od mediany, a połowa będzie równa lub wyższa od mediany. Nie wskazuje, jak blisko są te wartości do średniej.
Michael R. Chernick,
Rozumiem, że twoje ostatnie zdanie powinno kończyć się „medianą”? Jeśli tak, to wydaje mi się oczywiste, że mediana musi być (osiągalną) wartością najbliższą średniej (która może być nieosiągalna, np. Nie cena mieszkania) losowej próbki pobranej z populacji opisanej powyżej. Oznacza to, że mediana jest średnio najbliższa tej średniej próbie. Jeśli nie, nie twierdziłem, że wartości te są zbliżone do średniej. Twierdziłem o ich odległości do mediany.
Sol Hator