Kontrprzykłady, w których mediana jest poza [Mode-Mean]

11

Ten artykuł jest powyżej mojej ligi, ale mówi o interesującym mnie temacie, związku między środkiem, trybem i medianą. To mówi :

Powszechnie uważa się, że mediana rozkładu nieimodalnego jest „zwykle” pomiędzy średnią a modą. Jednak nie zawsze jest to prawdą ...

Moje pytanie : czy ktoś może podać przykłady ciągłych rozkładów unimodalnych (idealnie prostych), w których mediana jest poza przedziałem [tryb, średnia]? Na przykład dystrybucja taka jak mode < mean < median.

=== EDYCJA =======

Istnieją już dobre odpowiedzi Glen_b i Francisa, ale zdałem sobie sprawę, że naprawdę interesuje mnie przykład, w którym tryb <średnia <mediana lub mediana <średnia <tryb (to znaczy, że zarówno mediana jest poza [tryb, średnia] ORAZ mediana jest „po tej samej stronie” jako średnia dla trybu (tj. zarówno powyżej, jak i poniżej trybu). Mogę zaakceptować odpowiedzi tutaj są otwarte nowe pytanie, a może ktoś może bezpośrednio zasugerować rozwiązanie tutaj?

Janthelme
źródło
Nie ma problemu z rozszerzeniem odpowiedzi na bardziej ograniczoną sprawę.
Glen_b
2
Sprawdź rysunek 6 tutaj: ww2.amstat.org/publications/jse/v13n2/vonhippel.html, który daje (ciągły unimodalny) przykład Weibulla, w którym mediana nie znajduje się między trybem a średnią.
Matthew Towers,

Odpowiedzi:

14

Jasne, nietrudno jest znaleźć przykłady - nawet te ciągłe nieimodalne - gdzie mediana nie znajduje się pomiędzy średnią a modą.

  1. Rozważmy iid z trójkątnego rozkładu postaciT1,T2)faT.(t)=2)(1-t)10<t<1

    Teraz niech będzie 60-40 mieszanką i .T 1 - 4 T 2XT.1-4T.2)

    Gęstość wygląda następująco:X

    Mieszanina dwóch trójkątnych gęstości z medianą poza średnim przedziałem modowym

    Średnia jest poniżej 0, tryb wynosi 0, ale mediana jest wyższa od 0. Drobna modyfikacja tego dałaby przykład, w którym nawet gęstość (a nie tylko cdf) była ciągła, ale związek między miarami lokalizacji był to samo (edycja: patrz 3. poniżej).

  2. Uogólniając, umieśćmy proporcję (z ) całkowitego prawdopodobieństwa w trójkącie po prawej stronie i proporcję w trójkącie po lewej stronie (zamiast 0,6 i 0,4 mieliśmy wcześniej). Ponadto, ustaw współczynnik skalowania na lewej połowie zamiast (z ):0 < p < 1 ( 1 - p ) - βp0<p<1(1-p)-ββ > 0-4β>0

    gęstość dla uogólnionej wersji tej mieszaniny dwóch trójkątnych gęstości

    Teraz zakładając, że , mediana będzie zawsze w przedziale objętym prostokątnym trójkątem, więc mediana przekroczy tryb (który zawsze pozostanie na ). W szczególności, gdy , mediana będzie wynosić . 0p>1p>12)0 1-1/p>12)1-1/2)p

    Średnia będzie wynosić .(p-β(1-p))/3)

    Jeśli wówczas średnia będzie poniżej trybu, a jeśli średnia będzie powyżej trybu.β < p / ( 1 - p )β>p/(1-p)β<p/(1-p)

    Z drugiej strony chcemy aby utrzymać średnią poniżej mediany.(p-β(1-p))/3)<1-1/2)p

    Rozważ ; umieszcza to medianę powyżej trybu.p=0,7

    Wtedy spełnia więc średnia jest powyżej trybu.β < p / ( 1 - p )β=2)β<p/(1-p)

    Mediana w rzeczywistości wynosi podczas gdy średnia wynosi . Stąd dla i mamy tryb <średnia <mediana. 0,7 - 2 ( 0,3 )1-1/1.40,1548p=0,7β=20,7-2)(0,3)3)0,0333p=0,7β=2)

    (Uwaga: W celu zachowania spójności z moją notacją zmienna na osi x dla obu wykresów powinna wynosić zamiast ale nie zamierzam tego cofać i naprawiać.)txt

  3. Jest to przykład, w którym sama gęstość jest ciągła. Opiera się na podejściu z 1. i 2. powyżej, ale z „skokiem” zastąpionym stromym zboczem (a potem cała gęstość odwróciła się o 0, ponieważ chcę przykład, który wygląda na skośny).

    ciągła, częściowa gęstość liniowa z medianą <średnia <tryb

    [Stosując metodę „mieszanki gęstości trójkątnej”, można ją wygenerować jako mieszaninę 3 niezależnych skalowanych wariantów trójkątnej postaci opisanej w rozdziale 1. Mamy teraz 15% , 60% i 25% .] - 3 T 2 5 T 3T.1-3)T.2)5T.3)

    Jak widać na powyższym schemacie, średnia jest na środku, zgodnie z żądaniem.


  1. Zauważ, że m_t_ wspomina Weibulla w komentarzach (dla których mediana jest poza przedziałem dla małego zakresu parametru kształtu ). Jest to potencjalnie satysfakcjonujące, ponieważ jest to dobrze znany unimodalny ciągły (i gładki) rozkład o prostej formie funkcjonalnej.k[tryb,oznaczać]k

    W szczególności w przypadku małych wartości parametru kształtu Weibulla rozkład jest pochylony w prawo, a my mamy zwykle sytuację mediany między trybem a średnią, natomiast w przypadku dużych wartości parametru kształtu Weibulla rozkład jest pochylony w lewo , i znów mamy tę sytuację „mediany w środku” (ale teraz z trybem po prawej stronie, a nie średnią). Pomiędzy tymi przypadkami jest niewielki obszar, w którym mediana znajduje się poza przedziałem trybu średniego, a pośrodku tego średnia i tryb krzyżują się:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Wybierając dogodne wartości parametru kształtu w przedziałach oznaczonych (1) i (2) powyżej - tych, w których luki między statystykami lokalizacji są prawie równe - otrzymujemy:

    Gęstości Weibulla z medianą poza przedziałem średniego trybu

    Chociaż spełniają one wymagania, niestety trzy parametry lokalizacji są tak blisko siebie, że nie możemy ich wizualnie rozróżnić (wszystkie mieszczą się w tym samym pikselu), co jest nieco rozczarowujące - przypadki dla moich wcześniejszych przykładów są znacznie więcej rozdzielony. (Niemniej jednak sugeruje sytuacje do zbadania przy innych dystrybucjach, z których niektóre mogą dawać wyniki, które są bardziej wizualnie odmienne).

Glen_b - Przywróć Monikę
źródło
To działa, dzięki. Z ciekawości, czym byłby podobny „rozkład trójkątny”, gdzie mod <średnia <mediana? (tutaj mediana <tryb <średnia)
Janthelme
Właściwie w moim oryginalnym przykładzie oznacza <tryb <mediana; tam nierówności były zacofane. I dodany podobny przykład, w którym średnia wartość jest powyżej sposobu, ale poniżej mediany (rzeczywiście, można po prostu zastąpić oryginalny powiedzmy z i przechowywane proporcje mieszaniny na do prawej strony, a dla osób lewa część). - 1,25 T 2 0,6 0,4-4T.2)-1,25T.2)0,60,4
Glen_b
6

Poniższy przykład pochodzi z kontrprzykładów Jordana Stoyanova w prawdopodobieństwie .

Biorąc pod uwagę dodatnią stałą i , rozważ losową zmienną o gęstości średnie , mediana i tryb z może być znalezione Uwaga jest gęstością tylko wtedy, gdy Więc jeśli pozwolimy to . W rezultacie, jeśli wybierzemy który jest bliskodoλX

fa(x)={domi-λ(x-do),x(do,)x,x(0,do]0,x(-,0].
μmM.Xf ( x ) c 2
μ=do3)3)+do2)λ+doλ2),m=1,M.=do.
fa(x)c1λ2c>111.0001μ>cM=cmμM
do2)2)+doλ=1.
do1λ2)do>11 (powiedzmy ), możemy stwierdzić, że i , to średnia nie wchodzi między i .1.0001μ>doM.=domμM.
Francis
źródło
0

Weź rozkład wykładniczy z parametrem szybkości a i gęstością exp (-ax) dla 0 <= x <nieskończoności. Tryb jest ustawiony na zero. Oczywiście średnia i mediana są większe niż 0. Plik cdf to 1-exp (-ax). Więc dla mediany rozwiąż dla exp (-ax) = 0,5 dla x. Następnie -ax = ln (0,5) lub x = -ln (0,5) / a. Dla średniej całkuj ax exp (-ax) od 0 do nieskończoności. Weźmy a = 1 i mamy medianę = -ln (0,5) = ln (2) i średnią = 1.

Więc tryb <mediana <średnia.

Michael R. Chernick
źródło
1
Przepraszamy, ale czy nie szukamy dystrybucji, w których tryb <średnia <mediana (lub bardziej ogólnie, gdy mediana jest poza [tryb, średnia])?
Janthelme,
3
Przepraszam za zamieszanie, dodałem do pierwotnego pytania, ale to, o co pierwotnie pytałem, dotyczy przykładów, w których mediana znajduje się na zewnątrz [tryb, znaczy], podczas gdy myślę, że mediana jest wewnątrz [tryb, mediana] w twoim przykładzie.
Janthelme,
3
Michael, pytanie nie wymaga przypadku, w którym mediana znajduje się między trybem a średnią. Cytujesz oryginał w komentarzu tuż nad tym; w pytaniu nie jest napisane „tryb <mediana <znaczy”, w którym stwierdza się, że tak (i ​​nigdy tego nie robił w żadnym momencie historii edycji). W rezultacie twoja odpowiedź zawiera przypadek, o który nie jest proszony; w rzeczywistości jest to zwykła sytuacja (mediana pośrodku pozostałych dwóch), od której pytanie szuka wyjątków. Prawie każda dobrze znana wypaczona dystrybucja unimodalna ma medianę pośrodku - sztuczka polega na znalezieniu takich, które tego nie robią.
Glen_b
1
Historia edycji jest dostępna po kliknięciu czerwonego linku u dołu pytania, gdzie obecnie jest napisane „edytowane 18 godzin temu” (zmieniło się na 19, gdy pisałem te komentarze). Możesz zobaczyć historię zmian, klikając tam. Pytanie zostało opublikowane 22 godziny temu (gdy piszę to teraz), a po przejściu do historii edycji to oryginalne pytanie można zobaczyć na dole z etykietą „1”. Twoja odpowiedź pojawiła się około 2 godziny później (20 godzin temu), kiedy to wciąż brzmiało pytanie. Około 1-2 godziny po twoim wpisie OP raz edytował swoje pytanie, które można zobaczyć ...
Glen_b -Reinstate Monica
1
ctd ... u góry historii edycji .. Po każdej edycji jest dwuminutowe okno, aby wprowadzić zmiany, które liczą się jako część tej edycji (tj. 22 godziny temu i 18-19 godzin temu były dwie- okno minut za każdym razem, gdy powiedziano, że literówka mogła zostać naprawiona), ale ~ 20 godzin temu, kiedy pisałeś, pytanie pozostało niezmienione przez około 2 godziny i pozostało niezmienione przez ponad godzinę po opublikowaniu, gdy poważna edycja ( pokazane w historii edycji). Wszelkie zmiany poza tymi krótkimi, dwuminutowymi oknami po edycji byłyby w historii edycji.
Glen_b