Ten artykuł jest powyżej mojej ligi, ale mówi o interesującym mnie temacie, związku między środkiem, trybem i medianą. To mówi :
Powszechnie uważa się, że mediana rozkładu nieimodalnego jest „zwykle” pomiędzy średnią a modą. Jednak nie zawsze jest to prawdą ...
Moje pytanie : czy ktoś może podać przykłady ciągłych rozkładów unimodalnych (idealnie prostych), w których mediana jest poza przedziałem [tryb, średnia]? Na przykład dystrybucja taka jak mode < mean < median
.
=== EDYCJA =======
Istnieją już dobre odpowiedzi Glen_b i Francisa, ale zdałem sobie sprawę, że naprawdę interesuje mnie przykład, w którym tryb <średnia <mediana lub mediana <średnia <tryb (to znaczy, że zarówno mediana jest poza [tryb, średnia] ORAZ mediana jest „po tej samej stronie” jako średnia dla trybu (tj. zarówno powyżej, jak i poniżej trybu). Mogę zaakceptować odpowiedzi tutaj są otwarte nowe pytanie, a może ktoś może bezpośrednio zasugerować rozwiązanie tutaj?
Odpowiedzi:
Jasne, nietrudno jest znaleźć przykłady - nawet te ciągłe nieimodalne - gdzie mediana nie znajduje się pomiędzy średnią a modą.
Rozważmy iid z trójkątnego rozkładu postaciT.1, T2) faT.( t ) = 2 ( 1 - t ) 10 < t < 1
Teraz niech będzie 60-40 mieszanką i .T 1 - 4 T 2X T.1 - 4 T.2)
Gęstość wygląda następująco:X
Średnia jest poniżej 0, tryb wynosi 0, ale mediana jest wyższa od 0. Drobna modyfikacja tego dałaby przykład, w którym nawet gęstość (a nie tylko cdf) była ciągła, ale związek między miarami lokalizacji był to samo (edycja: patrz 3. poniżej).
Uogólniając, umieśćmy proporcję (z ) całkowitego prawdopodobieństwa w trójkącie po prawej stronie i proporcję w trójkącie po lewej stronie (zamiast 0,6 i 0,4 mieliśmy wcześniej). Ponadto, ustaw współczynnik skalowania na lewej połowie zamiast (z ):0 < p < 1 ( 1 - p ) - βp 0 < p < 1 ( 1 - p ) - β β > 0- 4 β> 0
Teraz zakładając, że , mediana będzie zawsze w przedziale objętym prostokątnym trójkątem, więc mediana przekroczy tryb (który zawsze pozostanie na ). W szczególności, gdy , mediana będzie wynosić . 0p>1p > 12) 0 1-1/√p > 12) 1 - 1 / 2 s--√
Średnia będzie wynosić .( p - β( 1 - p ) ) / 3
Jeśli wówczas średnia będzie poniżej trybu, a jeśli średnia będzie powyżej trybu.β < p / ( 1 - p )β>p/(1−p) β<p/(1−p)
Z drugiej strony chcemy aby utrzymać średnią poniżej mediany.( p - β( 1 - P ) ) / 3 < 1 - 1 / 2 s--√
Rozważ ; umieszcza to medianę powyżej trybu.p = 0,7
Wtedy spełnia więc średnia jest powyżej trybu.β < p / ( 1 - p )β= 2 β< p / ( 1 - p )
Mediana w rzeczywistości wynosi podczas gdy średnia wynosi . Stąd dla i mamy tryb <średnia <mediana. 0,7 - 2 ( 0,3 )1 - 1 / 1,4---√≈ 0,1548 p=0,7β=20,7 - 2 ( 0,3 )3)≈ 0,0333 p = 0,7 β= 2
(Uwaga: W celu zachowania spójności z moją notacją zmienna na osi x dla obu wykresów powinna wynosić zamiast ale nie zamierzam tego cofać i naprawiać.)tx t
Jest to przykład, w którym sama gęstość jest ciągła. Opiera się na podejściu z 1. i 2. powyżej, ale z „skokiem” zastąpionym stromym zboczem (a potem cała gęstość odwróciła się o 0, ponieważ chcę przykład, który wygląda na skośny).
[Stosując metodę „mieszanki gęstości trójkątnej”, można ją wygenerować jako mieszaninę 3 niezależnych skalowanych wariantów trójkątnej postaci opisanej w rozdziale 1. Mamy teraz 15% , 60% i 25% .] - 3 T 2 5 T 3T.1 - 3 T.2) 5 ton3)
Jak widać na powyższym schemacie, średnia jest na środku, zgodnie z żądaniem.
Zauważ, że m_t_ wspomina Weibulla w komentarzach (dla których mediana jest poza przedziałem dla małego zakresu parametru kształtu ). Jest to potencjalnie satysfakcjonujące, ponieważ jest to dobrze znany unimodalny ciągły (i gładki) rozkład o prostej formie funkcjonalnej.k[ tryb , średnia ] k
W szczególności w przypadku małych wartości parametru kształtu Weibulla rozkład jest pochylony w prawo, a my mamy zwykle sytuację mediany między trybem a średnią, natomiast w przypadku dużych wartości parametru kształtu Weibulla rozkład jest pochylony w lewo , i znów mamy tę sytuację „mediany w środku” (ale teraz z trybem po prawej stronie, a nie średnią). Pomiędzy tymi przypadkami jest niewielki obszar, w którym mediana znajduje się poza przedziałem trybu średniego, a pośrodku tego średnia i tryb krzyżują się:
Wybierając dogodne wartości parametru kształtu w przedziałach oznaczonych (1) i (2) powyżej - tych, w których luki między statystykami lokalizacji są prawie równe - otrzymujemy:
Chociaż spełniają one wymagania, niestety trzy parametry lokalizacji są tak blisko siebie, że nie możemy ich wizualnie rozróżnić (wszystkie mieszczą się w tym samym pikselu), co jest nieco rozczarowujące - przypadki dla moich wcześniejszych przykładów są znacznie więcej rozdzielony. (Niemniej jednak sugeruje sytuacje do zbadania przy innych dystrybucjach, z których niektóre mogą dawać wyniki, które są bardziej wizualnie odmienne).
źródło
Poniższy przykład pochodzi z kontrprzykładów Jordana Stoyanova w prawdopodobieństwie .
Biorąc pod uwagę dodatnią stałą i , rozważ losową zmienną o gęstości średnie , mediana i tryb z może być znalezione Uwaga jest gęstością tylko wtedy, gdy Więc jeśli pozwolimy to . W rezultacie, jeśli wybierzemy który jest bliskodo λ X
źródło
Weź rozkład wykładniczy z parametrem szybkości a i gęstością exp (-ax) dla 0 <= x <nieskończoności. Tryb jest ustawiony na zero. Oczywiście średnia i mediana są większe niż 0. Plik cdf to 1-exp (-ax). Więc dla mediany rozwiąż dla exp (-ax) = 0,5 dla x. Następnie -ax = ln (0,5) lub x = -ln (0,5) / a. Dla średniej całkuj ax exp (-ax) od 0 do nieskończoności. Weźmy a = 1 i mamy medianę = -ln (0,5) = ln (2) i średnią = 1.
Więc tryb <mediana <średnia.
źródło