Którego „środka” użyć i kiedy?

197

Mamy więc średnią arytmetyczną (AM), średnią geometryczną (GM) i średnią harmoniczną (HM). Ich matematyczne sformułowanie jest również dobrze znane wraz ze związanymi z nimi stereotypowymi przykładami (np. Średnia harmoniczna i jej zastosowanie do problemów związanych z „prędkością”).

Jednak zawsze mnie intrygowało pytanie: „jak zdecydować, który środek najlepiej zastosować w danym kontekście?”. Musi istnieć przynajmniej pewna ogólna zasada, która pomoże zrozumieć zastosowanie, a jednak najczęstszą odpowiedzią, na którą się natknąłem, jest: „To zależy” (ale od czego?).

To może wydawać się dość trywialne pytanie, ale nawet teksty z liceum nie wyjaśniły tego - zawierają jedynie definicje matematyczne!

Wolę angielskie tłumaczenie niż matematyczne - prosty test brzmiałby: „czy twoja mama / dziecko to zrozumie?”

Doktorat
źródło
20
Być może to upraszcza, ale zawsze korzystałem z zasięgu i obserwacji. Jeśli zakres jest taki sam = AM (porównaj wyniki 0-100, do 0-100), jeśli zakres jest inny, ale obserwacja jest taka sama = GM (porównaj wyniki 1-5, do 0-10), jeśli zakres jest taki sam, ale obserwacje są różne = HM (prędkość samochodu przy różnych obs, wysokości dwóch drabin, inne „stawki”).
Brandon Bertelsen,
> „To zależy” (ale od czego?) To zależy od algorytmu przetwarzania danych.
Macson,
To nie tylko wybór, którego środka użyć. Jest to także wybór zestawu statystyk podsumowujących opisujących populację lub proces zainteresowania. Nie należy myśleć, że wszystko, co jest potrzebne, to pojedyncza liczba opisująca coś, co może być bardzo skomplikowane.
JimB

Odpowiedzi:

160

Ta odpowiedź może mieć nieco bardziej matematyczny charakter niż się spodziewałeś.

Ważne jest, aby rozpoznać, że wszystkie te środki są po prostu arytmetycznymi środkami w przebraniu .

Ważną cechą przy określaniu, który (jeśli występuje!) Z trzech powszechnych środków (arytmetyczny, geometryczny lub harmoniczny) jest „właściwy”, oznacza znalezienie „struktury addytywnej” w danym pytaniu.

Innymi słowy, przypuśćmy, że otrzymaliśmy pewne abstrakcyjne wielkości , które nazwiebym „pomiarami”, nieco nadużywając tego terminu poniżej ze względu na spójność. Każdy z tych środków można uzyskać przez (1) dokonanie transformacji każdego x i w pewnym Y ı , (2) doprowadza się arytmetykę oznacza i następnie (3) przekształcenie z powrotem do oryginalnej skali pomiarów.x1,x2),,xnxjarja

Średnia arytmetyczna : Oczywiście używamy transformacji „tożsamości”: . Zatem kroki (1) i (3) są trywialne (nic się nie robi) i ˉ x A M = ˉ y .rja=xjax¯ZAM.=r¯

Średnia geometryczna : tutaj struktura addytywna znajduje się w logarytmach pierwotnych obserwacji. Tak więc bierzemy a następnie, aby uzyskać GM w kroku (3), przekształcamy z powrotem za pomocą funkcji odwrotnej log , tj. ˉ x G M = exp ( ˉ y ) .rja=logxjalogx¯solM.=exp(r¯)

Średnia harmoniczna : tutaj struktura addytywna jest odwrotna do naszych obserwacji. Zatem , skąd ˉ x H M = 1 / ˉ y .rja=1/xjax¯HM=1/y¯

W przypadku problemów fizycznych często powstają one w następującym procesie: Mamy pewną ilość która pozostaje stała w stosunku do naszych pomiarów x 1 , , x n i niektóre inne wielkości, powiedzmy z 1 , , z n . Teraz gramy w następującą grę: Utrzymuj w i z 1 + + z n stałą i spróbuj znaleźć trochę ˉ x, tak że jeśli zastąpimy każdą z naszych indywidualnych obserwacji x i przezwx1,,xnz1,,znwz1++znx¯xjax¯, wówczas relacja „całkowita” jest nadal zachowana .

Przykład dystans-prędkość-czas wydaje się popularny, więc skorzystajmy z niego.

Stała odległość, różne czasy

Rozważyć ustalony przejechany dystans . Załóżmy teraz, że pokonujemy ten dystans różnych czasów przy prędkościach , biorąc czasy . Teraz gramy w naszą grę. Załóżmy, że chcieliśmy zastąpić nasze indywidualne prędkości pewną stałą prędkością tak aby całkowity czas pozostał stały. Zauważ, że mamy więc . Chcemy, aby ten całkowity związek (całkowity czas i całkowity przebyty dystans) został zachowany, gdy zastąpimy każdy z przez w naszej grze. Dlatego v i ˉ v n d - ˉ v i t i = 0rev 1 , , v n t 1 , , t n ˉ v d - v i t i = 0nv1,,vnt1,,tnv¯i ( d - v i t i ) = 0

re-vjatja=0,
ja(re-vjatja)=0vjav¯t i = d / v i ˉ v = n
nre-v¯jatja=0,
a ponieważ każdy , otrzymujemy tja=re/vja
v¯=n1v1++1vn=v¯H.M..

Zauważ, że „struktura addytywna” odnosi się do poszczególnych czasów, a nasze pomiary są z nimi odwrotnie powiązane, dlatego obowiązuje średnia harmoniczna.

Różne odległości, stały czas

Teraz zmieńmy sytuację. Załóżmy, że dla przypadków przemierzamy stały czas przy prędkościach na odległościach . Teraz chcemy zachować całkowity dystans. Mamy a cały system jest zachowany, jeśli . Grając ponownie w naszą grę, szukamy takiego, że ale ponieważ , otrzymujemy t v 1 , , v n d 1 , , d n d i - v i t = 0ntv1,,vnre1,,reni ( d i - v i t ) = 0 ˉ v i ( d i - ˉ v t ) = 0

reja-vjat=0,
ja(reja-vjat)=0v¯d i = v i t ˉ v = 1
ja(reja-v¯t)=0,
reja=vjat
v¯=1njavja=v¯ZAM..

Tutaj struktura addytywna, którą staramy się zachować, jest proporcjonalna do posiadanych pomiarów, więc obowiązuje średnia arytmetyczna.

Kostka o równej objętości

Załóżmy, że zbudowaliśmy wymiarowe pudełko o danej objętości a nasze pomiary są długościami bocznymi pudełka. Następnie i załóżmy, że chcieliśmy zbudować wymiarową (hiper) kostkę o tym samym wolumenie. Oznacza to, że chcemy zastąpić nasze indywidualne długości boczne wspólnymi długościami bocznymi . Następnie V V = x 1x 2x nnV.n x i ˉ x V = ˉ xˉ xˉ x = ˉ x n

V.=x1x2)xn,
nxjax¯
V.=x¯x¯x¯=x¯n.

To łatwo wskazuje, że powinniśmy wziąć .x¯=(xjaxn)1/n=x¯solM.

Zauważ, że struktura addytywna jest w logarytmach, to znaczy i staramy się zachować lewą liczbę.logV.=jalogxja

Nowe środki od dawna

W ramach ćwiczenia zastanów się, co oznacza „naturalny” w sytuacji, w której zarówno odległości, jak i czasy różnią się w pierwszym przykładzie. Oznacza to, że mamy odległości , prędkości i czasy . Chcemy zachować całkowity przejechany dystans i czas oraz znaleźć stałą dla osiągnięcia tego.v i t i ˉ vrejavjatjav¯

Ćwiczenie : co oznacza „naturalny” w tej sytuacji?

kardynał
źródło
25
+1 To świetna odpowiedź. Uważam jednak, że jest to niepełne w istotny sposób: w wielu przypadkach właściwy sposób użycia zależy od pytania, na które próbujemy odpowiedzieć, a nie od jakiejkolwiek struktury matematycznej w danych. Dobry przykład tego występuje w ocenie ryzyka środowiskowego: organy regulacyjne chcą oszacować całkowite narażenie populacji na zanieczyszczenia w czasie. To wymaga odpowiednio średnia ważona, choć dane stężenie środowiskowe mają zazwyczaj zwielokrotniony strukturę. Średnia geometryczna byłaby niewłaściwym estymatorem lub estymatorem.
whuber
7
@whuber: (+1) To jest doskonały komentarz. Na mojej drodze do zbudowania odpowiedzi wybrałem zdecydowanie niestatystyczny widelec, więc cieszę się, że o tym wspomniałeś. Jest to temat warty pełnej odpowiedzi ( podpowiedź ).
kardynał
9
@whuber: Przywołuje również fakt (być może nieumyślnie), że analiza statystyczna może często podlegać nadzorowi ekspertów dziedzinowych (lub, w twoim przypadku, nawet nie-ekspertów), którzy chcą oszacować coś znaczącego dla ich dziedziny, ale prawie całkowicie nienaturalne statystycznie. Problem, w którym natknąłem się w przeszłości, polega na tym, że czasami chcą też dyktować sposób przeprowadzania szacunków statystycznych! :)
kardynał
1
@ whuber: Byłoby bardzo mile widziane, gdybyś mógł dodać ten punkt widzenia do odpowiedzi, z pewnym dopracowaniem. Szczerze mówiąc, twoje wyjaśnienia są jednymi z najlepszych, jakie widziałem na Stats.SE!
PhD
3
Zwykły świetny komentarz od @whuber. Czasami (być może często!) Właściwym środkiem jest brak ; raczej często należy rozszerzyć pytanie na „jaką miarę tendencji centralnej powinienem zastosować?”.
Peter Flom
43

Rozszerzenie doskonałego komentarza @Brandon (który moim zdaniem powinien być promowany w celu udzielenia odpowiedzi):

Średnia geometryczna powinna być używana, gdy jesteś zainteresowany różnicami multiplikatywnymi. Brandon zauważa, że ​​gdy zakresy są różne, należy stosować średnią geometryczną. Zazwyczaj jest to poprawne. Powodem jest to, że chcemy wyrównać zakresy. Załóżmy na przykład, że kandydaci na studia są oceniani na podstawie oceny SAT (od 0 do 800), średniej ocen w HS (od 0 do 4) i zajęć pozalekcyjnych (od 1 do 10). Gdyby uczelnia chciała je uśrednić i wyrównać zakresy (to znaczy wzrost masy w każdej jakości względem zakresu), to droga geometryczna byłaby dobrym rozwiązaniem.

Ale nie zawsze jest to prawdą, gdy mamy skale o różnych zakresach. Gdybyśmy porównywali dochody w różnych krajach (w tym biednych i bogatych), prawdopodobnie nie chcielibyśmy średniej geometrycznej, ale średniej arytmetycznej (lub, co bardziej prawdopodobne, mediany lub średniej obciętej).

Jedynym zastosowaniem, jakie widziałem dla średniej harmonicznej, jest porównywanie stawek. Na przykład: jeśli jedziesz z Nowego Jorku do Bostonu przy 40 MPH, a wracasz przy 60 MPH, ogólna średnia nie jest średnią arytmetyczną 50 MPH, ale średnią harmoniczną.

(40+60)/2)=502)/(1/40+1/60)=48

240/5=48

Peter Flom
źródło
3
Dlaczego Twój przykład SAT / GPA / pozaszkolny używałby średniej geometrycznej zamiast ważonej lub skalowanej średniej arytmetycznej? Dlaczego zerowa wartość SAT lub GPA powinna oznaczać, że pozostałe dwie wartości stają się nieistotne (jak sugerowałaby średnia geometryczna)? A jeśli (powiedzmy) zajęcia pozalekcyjne skupiają się w znacznie węższym paśmie niż jego teoretyczny zakres? Wydaje się, że bardziej sensowne byłoby przyjęcie średniej arytmetycznej percentyli (lub innych skorygowanych wartości) niż geometrycznej średniej wartości surowych.
ruakh
1
@ruakh Ciekawe. Kwestia 0 tak naprawdę nie ma znaczenia w tym przypadku, ponieważ SAT i GPA nie mogą tak naprawdę wynosić 0 (SAT = 0 jest prawie niemożliwe, a GPA 0 nie ukończyłoby studiów). Myślę, że średnia arytmetyczna percentyli będzie zbliżona do średniej geometrycznej we wnioskach (choć nie w liczbach rzeczywistych).
Peter Flom
31

Spróbuję sprowadzić go do 3-4 praktycznych zasad i podam więcej przykładów pitagorejskich środków.

Zależność między 3 średnimi wynosi HM <GM <AM dla danych nieujemnych z pewnymi zmianami . Będą one równe wtedy i tylko wtedy, gdy nie będzie żadnych zmian w przykładowych danych.

W przypadku danych w poziomach użyj AM. Ceny są dobrym przykładem. W przypadku wskaźników użyj GM. Zwroty z inwestycji, ceny względne, takie jak indeks Bloomberga Billy'ego (cena półki na książki Ikei Billy w różnych krajach w porównaniu do ceny w USA) oraz wskaźnik rozwoju społecznego ONZ są przykładami. HM jest odpowiedni w przypadku stawek. Oto niemotoryzacyjny przykład dzięki uprzejmości Davida Gilesa :

Weźmy na przykład dane dotyczące „przepracowanych godzin tygodniowo” (stawka). Załóżmy, że mamy cztery osoby (przykładowe obserwacje), z których każda pracuje łącznie 2000 godzin. Pracują jednak dla różnych godzin w tygodniu, jak następuje:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

Średnia arytmetyczna wartości w trzeciej kolumnie wynosi AM = 42,5 godziny tygodniowo. Zauważ jednak, co implikuje ta wartość. Dzieląc całkowitą liczbę tygodni przepracowanych przez członków próby (8 000) przez tę średnią wartość, uzyskujemy wartość 188,2353 jako całkowitą liczbę tygodni przepracowanych przez wszystkie cztery osoby.

Teraz spójrz na ostatnią kolumnę w powyższej tabeli. W rzeczywistości prawidłowa wartość całkowitej liczby tygodni przepracowanych przez członków próby wynosi 191,5873 tygodni. Jeśli obliczymy średnią harmoniczną dla wartości godzin na tydzień w trzeciej kolumnie tabeli, otrzymamy HM = 41,75642 godziny (<AM), a podzielenie tej liczby na 8000 godzin daje nam poprawny wynik 191,5873 dla liczby całkowitej tygodni przepracowanych. Oto przypadek, w którym średnia harmoniczna zapewnia odpowiedni pomiar średniej próbki.

David omawia także ważoną wersję 3 średnich, które pojawiają się we wskaźnikach cen używanych do pomiaru inflacji.

Porwanie na bok:

Te ROTy nie są idealne. Na przykład często trudno mi ustalić, czy coś jest stopą, czy współczynnikiem. Zwroty z inwestycji są zwykle traktowane jako stosunek przy obliczaniu średnich, ale są również stopą, ponieważ są zwykle wyrażane w „x% na jednostkę czasu”. Czy „użycie HM, gdy dane są poziomami na jednostkę czasu” byłoby lepszą heurystyką?

Jeśli chciałbyś podsumować indeks Big Mac dla krajów Europy Północnej, czy użyłbyś GM?

Dimitriy V. Masterov
źródło
3
Kilka lat spóźnienia, ale czy kiedykolwiek znalazłeś odpowiedź na swoje pytanie: „Czy chciałbyś podsumować indeks Big Mac dla krajów Europy Północnej, czy użyłbyś GM?” ?
StatsScared
2
@StatsScared Nope, ale to byłoby miłe pytanie!
Dimitriy V. Masterov
7

Możliwą odpowiedzią na twoje pytanie („jak zdecydować, który środek jest najbardziej odpowiedni w danym kontekście?”) Jest definicja środka podana przez włoskiego matematyka Oscara Chisiniego .

Oto artykuł z bardziej szczegółowym wyjaśnieniem i kilkoma przykładami (średnia prędkość podróży i inne).

Boskowicz
źródło
6
Idealnie byłoby, gdybyś mógł dodać tutaj kilka wierszy do definicji Chisini na wypadek, gdyby link zginął, i / lub aby pomóc czytelnikom dowiedzieć się, czy chcą kliknąć link, aby dalej realizować pomysły.
gung
2
Rzeczywiście, link do gazety jest martwy. Łącze Wolfram nie zapewnia wglądu w to, w jaki sposób definicja Chisini jest przydatna do określania, który sposób użyć w danym kontekście; wydaje mi się jedynie matematycznym uogólnieniem w przeciwieństwie do recepty użycia.
Ryan Simmons,
1
Korzystając z DOI, widać, że papier został przeniesiony na tandfonline.com. Cytowanie: R Graziani, P Veronese (2009). Jak obliczyć średnią? Podejście Chisini i jego zastosowania. The American Statistician 63 (1), s. 33–36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf
0

Myślę, że prostym sposobem na udzielenie odpowiedzi na to pytanie byłoby:

  1. Jeśli struktura matematyczna to xy = k (odwrotna zależność między zmiennymi) i szukasz średniej, to musisz użyć średniej harmonicznej - która stanowi ważoną średnią arytmetyczną - rozważ

Średnia harmoniczna = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

Na przykład: uśrednianie kosztów w dolarach należy do tej kategorii, ponieważ kwota, którą inwestujesz (A) pozostaje stała, ale cena za akcję (P) i liczba akcji (N) jest różna (A = PN). W rzeczywistości, jeśli myślisz o średniej arytmetycznej jako liczbie równomiernie wyśrodkowanej między dwiema liczbami, średnia harmoniczna jest również liczbą równomiernie wyśrodkowaną między dwiema liczbami, ale (i to jest miłe) „centrum” jest tam, gdzie są procenty (stosunki) równy. To znaczy: (x - a) / a = (b -x) / b, gdzie x jest średnią harmoniczną.

  1. Jeśli struktura matematyczna jest bezpośrednią odmianą y = kx, używasz średniej arytmetycznej - do której redukuje się w tym przypadku średnia harmoniczna.
Ira Nirenberg
źródło
1
$x$x\frac{a}{b}zab
Powiedzmy, że chcesz zestawić średnie prawdopodobieństwa kilku różnych modeli. W takim przypadku, czy kiedykolwiek sensowne jest stosowanie środka geometrycznego lub harmonicznego?
thecity2