Czy istnieje wzór na obliczanie mediany?

10

Czy istnieje odpowiednik średniej formuły:

mean=1Ni=1NXi

dla mediany?

Craig
źródło

Odpowiedzi:

16

Jeśli zdefiniujesz jako posortowaną wersję oryginalnych danych X 1 , X 2 , , X N , wówczas mediana zostanie zdefiniowana jako:O1,O2,,ONX1,X2,,XN

Median({O1,O2,,ON})={O(N+1)/2if N is odd(ON/2+ON/2+1)/2otherwise

Bez porządkowania danych możesz użyć definicji mediany geometrycznej, aby zdefiniować medianę w jednym wymiarze:

Median({X1,X2,,XN})=argminyi=1N|Xiy|

Zauważ, że niekoniecznie oznacza to unikalną medianę, gdy liczba parzystych punktów jest równa; na przykład dowolna liczba optymalizuje cel z .y[3,4]X={2,3,4,5}

josliber
źródło
3
Formularz dla nawet nie jest jedyną odpowiedzią - jest to tylko konwencja. Każda wartość między a może być rozsądnie nazwana „medianą”O N / 2 O N / 2 + 1NON/2ON/2+1
prawdopodobieństwo
1
@probabilityislogic Na pewno. Dodałem geometryczną definicję mediany, która niekoniecznie jest unikalna nawet dlaN
josliber
10

Jednym z alternatywnych sposobów wyrażenia średniej jest oszacowanie „najmniejszych kwadratów”:

i=1N(Xim)2

Wybranie jako średniej daje najmniejszą wartość sumy kwadratów błędów.m

Teraz medianę można wyrazić jako oszacowanie „najmniejszych odchyleń bezwzględnych”:

i=1N|Xim|

Wybranie jako mediany daje najmniejszą wartość sumy błędów bezwzględnych.m

prawdopodobieństwo prawdopodobieństwa
źródło
0

Mediana to wartość odpowiadająca połowie kwantyla, czyli połowa wartości jest wyższa, połowa jest mniejsza (wybacz mi za ignorowanie przypadków z równością lub gdy zbiór jest parzysty ...). Tak, że biorąc pod uwagę, że plik pdf zestawu danych jest znany, rozkład skumulowany można łatwo ocenić. Zwracając uwagę na tej funkcji, a następnie pXP X m e d i a n = P - 1 X ( 1X1XnPX

median=PX1(12)

Weźmy na przykład przypadek dla kątów w tej metodzie użytej w tym artykule przeglądowym do wyrównywania histogramu. wyrównanie histogramu Lewy dolny panel pokazuje pdf kątów w zestawie naturalnych obrazów. to rozkład skumulowany, a mediana to wartość odpowiadająca wartości , czyli w tym przypadku około .P ( θ ) θ 1 / 2 0p(θ)P(θ)θ1/20

meduz
źródło