Analizuję rozkład opóźnień w sieci. Mediana czasu przesyłania (U) wynosi 0,5 s. Mediana czasu pobierania (D) wynosi 2 s. Jednak średni czas całkowity (dla każdego punktu danych T = U + D) wynosi 4 s.
Jakie wnioski można wyciągnąć, wiedząc, że mediana sumy jest znacznie większa niż suma median dodatków?
Z ciekawości statystyk, co by to znaczyło, gdyby to pytanie zastąpiło medianę średnią?
random-variable
median
summations
David Faux
źródło
źródło
Odpowiedzi:
Mediany nie są liniowe, więc istnieje wiele okoliczności, w których może się zdarzyć coś takiego (tj. ) .median(X1)+median(X2)<median(X1+X2)
Bardzo łatwo jest skonstruować dyskretne przykłady, w których zachodzi taka sytuacja, ale jest to również powszechne w ciągłych sytuacjach.
Na przykład może się to zdarzyć przy przekrzywionych ciągłych rozkładach - przy ciężkim prawym ogonie mediany mogą być zarówno małe, ale mediana sumy jest „podciągnięta”, ponieważ istnieje duża szansa, że jedno z dwóch jest duże, a wartość powyżej mediana zwykle będzie znacznie powyżej niej, co spowoduje, że mediana sumy będzie większa niż suma median.
Oto wyraźny przykład: weź . Zatem i mają medianę więc suma median jest mniejsza niż , ale nazwa która ma medianę (w rzeczywistości według Wolfram Alpha)X1,X2∼i.i.d.Exp(1) X1 X2 log(2)≈0.693 1.4 X1+X2∼Gamma(2,1) ≈1.678 −W−1(−12e)−1
źródło