Mamy więc średnią arytmetyczną (AM), średnią geometryczną (GM) i średnią harmoniczną (HM). Ich matematyczne sformułowanie jest również dobrze znane wraz ze związanymi z nimi stereotypowymi przykładami (np. Średnia harmoniczna i jej zastosowanie do problemów związanych z „prędkością”).
Jednak zawsze mnie intrygowało pytanie: „jak zdecydować, który środek najlepiej zastosować w danym kontekście?”. Musi istnieć przynajmniej pewna ogólna zasada, która pomoże zrozumieć zastosowanie, a jednak najczęstszą odpowiedzią, na którą się natknąłem, jest: „To zależy” (ale od czego?).
To może wydawać się dość trywialne pytanie, ale nawet teksty z liceum nie wyjaśniły tego - zawierają jedynie definicje matematyczne!
Wolę angielskie tłumaczenie niż matematyczne - prosty test brzmiałby: „czy twoja mama / dziecko to zrozumie?”
Odpowiedzi:
Ta odpowiedź może mieć nieco bardziej matematyczny charakter niż się spodziewałeś.
Ważne jest, aby rozpoznać, że wszystkie te środki są po prostu arytmetycznymi środkami w przebraniu .
Ważną cechą przy określaniu, który (jeśli występuje!) Z trzech powszechnych środków (arytmetyczny, geometryczny lub harmoniczny) jest „właściwy”, oznacza znalezienie „struktury addytywnej” w danym pytaniu.
Innymi słowy, przypuśćmy, że otrzymaliśmy pewne abstrakcyjne wielkości , które nazwiebym „pomiarami”, nieco nadużywając tego terminu poniżej ze względu na spójność. Każdy z tych środków można uzyskać przez (1) dokonanie transformacji każdego x i w pewnym Y ı , (2) doprowadza się arytmetykę oznacza i następnie (3) przekształcenie z powrotem do oryginalnej skali pomiarów.x1,x2,…,xn xi yi
Średnia arytmetyczna : Oczywiście używamy transformacji „tożsamości”: . Zatem kroki (1) i (3) są trywialne (nic się nie robi) i ˉ x A M = ˉ y .rja= xja x¯A M.= y¯
Średnia geometryczna : tutaj struktura addytywna znajduje się w logarytmach pierwotnych obserwacji. Tak więc bierzemy a następnie, aby uzyskać GM w kroku (3), przekształcamy z powrotem za pomocą funkcji odwrotnej log , tj. ˉ x G M = exp ( ˉ y ) .rja= logxja log x¯G M= exp( y¯)
Średnia harmoniczna : tutaj struktura addytywna jest odwrotna do naszych obserwacji. Zatem , skąd ˉ x H M = 1 / ˉ y .rja= 1 / xja x¯H M=1/y¯
W przypadku problemów fizycznych często powstają one w następującym procesie: Mamy pewną ilość która pozostaje stała w stosunku do naszych pomiarów x 1 , … , x n i niektóre inne wielkości, powiedzmy z 1 , … , z n . Teraz gramy w następującą grę: Utrzymuj w i z 1 + ⋯ + z n stałą i spróbuj znaleźć trochę ˉ x, tak że jeśli zastąpimy każdą z naszych indywidualnych obserwacji x i przezw x1,…,xn z1, … , Zn w z1+ ⋯ + zn x¯ xja x¯ , wówczas relacja „całkowita” jest nadal zachowana .
Przykład dystans-prędkość-czas wydaje się popularny, więc skorzystajmy z niego.
Stała odległość, różne czasy
Rozważyć ustalony przejechany dystans . Załóżmy teraz, że pokonujemy ten dystans różnych czasów przy prędkościach , biorąc czasy . Teraz gramy w naszą grę. Załóżmy, że chcieliśmy zastąpić nasze indywidualne prędkości pewną stałą prędkością tak aby całkowity czas pozostał stały. Zauważ, że mamy więc . Chcemy, aby ten całkowity związek (całkowity czas i całkowity przebyty dystans) został zachowany, gdy zastąpimy każdy z przez w naszej grze. Dlatego v i ˉ v n d - ˉ v ∑ i t i = 0re v 1 , … , v n t 1 , … , t n ˉ v d - v i t i = 0n v1, … , Vn t1, … , Tn v¯ ∑ i ( d - v i t i ) = 0
Zauważ, że „struktura addytywna” odnosi się do poszczególnych czasów, a nasze pomiary są z nimi odwrotnie powiązane, dlatego obowiązuje średnia harmoniczna.
Różne odległości, stały czas
Teraz zmieńmy sytuację. Załóżmy, że dla przypadków przemierzamy stały czas przy prędkościach na odległościach . Teraz chcemy zachować całkowity dystans. Mamy a cały system jest zachowany, jeśli . Grając ponownie w naszą grę, szukamy takiego, że ale ponieważ , otrzymujemy t v 1 , … , v n d 1 , … , d n d i - v i t = 0n t v1, … , Vn re1, … , Dn ∑ i ( d i - v i t ) = 0 ˉ v ∑ i ( d i - ˉ v t ) = 0
Tutaj struktura addytywna, którą staramy się zachować, jest proporcjonalna do posiadanych pomiarów, więc obowiązuje średnia arytmetyczna.
Kostka o równej objętości
Załóżmy, że zbudowaliśmy wymiarowe pudełko o danej objętości a nasze pomiary są długościami bocznymi pudełka. Następnie i załóżmy, że chcieliśmy zbudować wymiarową (hiper) kostkę o tym samym wolumenie. Oznacza to, że chcemy zastąpić nasze indywidualne długości boczne wspólnymi długościami bocznymi . Następnie V V = x 1 ⋅ x 2 ⋯ x nn V. n x i ˉ x V = ˉ x ⋅ ˉ x ⋯ ˉ x = ˉ x n
To łatwo wskazuje, że powinniśmy wziąć .x¯= ( xja⋯ xn)1 / n= x¯G M
Zauważ, że struktura addytywna jest w logarytmach, to znaczy i staramy się zachować lewą liczbę.logV.= ∑jalogxja
Nowe środki od dawna
W ramach ćwiczenia zastanów się, co oznacza „naturalny” w sytuacji, w której zarówno odległości, jak i czasy różnią się w pierwszym przykładzie. Oznacza to, że mamy odległości , prędkości i czasy . Chcemy zachować całkowity przejechany dystans i czas oraz znaleźć stałą dla osiągnięcia tego.v i t i ˉ vreja vja tja v¯
Ćwiczenie : co oznacza „naturalny” w tej sytuacji?
źródło
Rozszerzenie doskonałego komentarza @Brandon (który moim zdaniem powinien być promowany w celu udzielenia odpowiedzi):
Średnia geometryczna powinna być używana, gdy jesteś zainteresowany różnicami multiplikatywnymi. Brandon zauważa, że gdy zakresy są różne, należy stosować średnią geometryczną. Zazwyczaj jest to poprawne. Powodem jest to, że chcemy wyrównać zakresy. Załóżmy na przykład, że kandydaci na studia są oceniani na podstawie oceny SAT (od 0 do 800), średniej ocen w HS (od 0 do 4) i zajęć pozalekcyjnych (od 1 do 10). Gdyby uczelnia chciała je uśrednić i wyrównać zakresy (to znaczy wzrost masy w każdej jakości względem zakresu), to droga geometryczna byłaby dobrym rozwiązaniem.
Ale nie zawsze jest to prawdą, gdy mamy skale o różnych zakresach. Gdybyśmy porównywali dochody w różnych krajach (w tym biednych i bogatych), prawdopodobnie nie chcielibyśmy średniej geometrycznej, ale średniej arytmetycznej (lub, co bardziej prawdopodobne, mediany lub średniej obciętej).
Jedynym zastosowaniem, jakie widziałem dla średniej harmonicznej, jest porównywanie stawek. Na przykład: jeśli jedziesz z Nowego Jorku do Bostonu przy 40 MPH, a wracasz przy 60 MPH, ogólna średnia nie jest średnią arytmetyczną 50 MPH, ale średnią harmoniczną.
źródło
Spróbuję sprowadzić go do 3-4 praktycznych zasad i podam więcej przykładów pitagorejskich środków.
Zależność między 3 średnimi wynosi HM <GM <AM dla danych nieujemnych z pewnymi zmianami . Będą one równe wtedy i tylko wtedy, gdy nie będzie żadnych zmian w przykładowych danych.
W przypadku danych w poziomach użyj AM. Ceny są dobrym przykładem. W przypadku wskaźników użyj GM. Zwroty z inwestycji, ceny względne, takie jak indeks Bloomberga Billy'ego (cena półki na książki Ikei Billy w różnych krajach w porównaniu do ceny w USA) oraz wskaźnik rozwoju społecznego ONZ są przykładami. HM jest odpowiedni w przypadku stawek. Oto niemotoryzacyjny przykład dzięki uprzejmości Davida Gilesa :
David omawia także ważoną wersję 3 średnich, które pojawiają się we wskaźnikach cen używanych do pomiaru inflacji.
Porwanie na bok:
Te ROTy nie są idealne. Na przykład często trudno mi ustalić, czy coś jest stopą, czy współczynnikiem. Zwroty z inwestycji są zwykle traktowane jako stosunek przy obliczaniu średnich, ale są również stopą, ponieważ są zwykle wyrażane w „x% na jednostkę czasu”. Czy „użycie HM, gdy dane są poziomami na jednostkę czasu” byłoby lepszą heurystyką?
Jeśli chciałbyś podsumować indeks Big Mac dla krajów Europy Północnej, czy użyłbyś GM?
źródło
Możliwą odpowiedzią na twoje pytanie („jak zdecydować, który środek jest najbardziej odpowiedni w danym kontekście?”) Jest definicja środka podana przez włoskiego matematyka Oscara Chisiniego .
Oto artykuł z bardziej szczegółowym wyjaśnieniem i kilkoma przykładami (średnia prędkość podróży i inne).
źródło
Myślę, że prostym sposobem na udzielenie odpowiedzi na to pytanie byłoby:
Średnia harmoniczna = 2ab / (a + b) = a (b / a + b) + b (a / (a + b)
Na przykład: uśrednianie kosztów w dolarach należy do tej kategorii, ponieważ kwota, którą inwestujesz (A) pozostaje stała, ale cena za akcję (P) i liczba akcji (N) jest różna (A = PN). W rzeczywistości, jeśli myślisz o średniej arytmetycznej jako liczbie równomiernie wyśrodkowanej między dwiema liczbami, średnia harmoniczna jest również liczbą równomiernie wyśrodkowaną między dwiema liczbami, ale (i to jest miłe) „centrum” jest tam, gdzie są procenty (stosunki) równy. To znaczy: (x - a) / a = (b -x) / b, gdzie x jest średnią harmoniczną.
źródło
$x$
\frac{a}{b}