Dlaczego nie używamy ważonej średniej arytmetycznej zamiast średniej harmonicznej?

12

Zastanawiam się, jaka jest wewnętrzna wartość stosowania średniej harmonicznej (na przykład do obliczania miar F), a nie ważonej średniej arytmetycznej w łączeniu precyzji i przypominania? Myślę, że ważona średnia arytmetyczna może odgrywać rolę średniej harmonicznej, czy coś mi brakuje?

Olga
źródło
9
Średnia harmoniczna jest ważoną średnią arytmetyczną: każdy ma wagę proporcjonalną do 1 / x 2 i . xi1/xi2
whuber
Czy możesz powiedzieć coś więcej o tym, jak precyzja i pamięć zwrotna są połączone w ten sposób?
AdamO,
6
@whuber Nie jestem pewien, czy Twój komentarz jest poważny, czy też zdziwiony. Zwykle przyjmuje się, że wagi są funkcją indeksu próbki , a nie wartości próbki . W przeciwnym razie każdy środek jest średnią ważoną arytmetyczną
Luis Mendo
2
@Luis Prawda leży pomiędzy. Indeks próbki często nie ma znaczenia. Wagi są funkcjami obiektów, ale funkcje te zwykle nie zależą od uśrednionych wartości. Przykładami są wagi związane z czasem (EWMA), z lokalizacją (jak w miarach korelacji przestrzennej), rangą (jak w teście Shapiro-Wilka) i prawdopodobieństwami próbkowania. Ale nie wszystkie środki są ważonymi AM: na przykład MG nie jest. Ponieważ Filippa pyta o „wartość instruktażową”, wydawało się niemądre wskazywać matematyczny związek między średnią harmoniczną a średnią ważoną.
whuber

Odpowiedzi:

18

Ogólnie rzecz biorąc, środki harmoniczne są preferowane, gdy próbuje się uśrednić stawki zamiast liczb całkowitych. W przypadku miary F1 średnia harmoniczna będzie karać bardzo małe dokładności lub przywołania, podczas gdy nieważona średnia arytmetyczna nie. Wyobraź sobie uśrednienie 100% i 0%: średnia arytmetyczna wynosi 50%, a średnia harmoniczna 0%. Średnia harmoniczna wymaga, aby zarówno precyzja, jak i przywoływanie były wysokie.

Ponadto, gdy precyzja i przywołanie są blisko siebie, średnia harmoniczna będzie bliska średniej arytmetycznej. Przykład: średnia harmoniczna 95% i 90% wynosi 92,4% w porównaniu ze średnią arytmetyczną 92,5%.

To, czy jest to pożądana właściwość, zależy prawdopodobnie od przypadku użycia, ale zazwyczaj jest uważane za dobre.

Na koniec zauważ, że, jak stwierdził @whuber w komentarzach, średnia harmoniczna jest rzeczywiście ważoną średnią arytmetyczną.

ilanman
źródło
2
„środki harmoniczne są preferowane, gdy ktoś próbuje uśrednić stawki”. Być może, jeśli przejedziesz km z prędkością 120 km / hi 10 km z powrotem z prędkością 60 km / h, aby uzyskać średnią całkowitą prędkość 80 km / h, ale nie jeśli przejechać 10 minut przy 120 km / hi 10 minut przy 60 km / h, aby uzyskać średnią całkowitą prędkość 90 km / h. Ale nie rozumiem, dlaczego dotyczy to ułamków1012010608010120106090
Henry
Rzeczywiście, pierwszy akapit jest bardziej ogólnym stwierdzeniem na temat średniej harmonicznej. Ale masz rację, precyzja i przypominanie to ułamki, a nie stawki. Uważam, że istnieje pojęcie, że średnia arytmetyczna jest preferowana dla wartości, które mają interpretowalne sumowanie (które nie miałyby zastosowania w tym przypadku), ale na pewno można przyjąć średnią arytmetyczną precyzji i przywołać i uzyskać użyteczny wynik.
ilanman
Świetny! Bardziej szukam „uzasadnień” stosowania reguły uśredniania harmonicznego. Ale nie jestem pewien, jak myśleć o uzasadnieniach.
Olga
10

Średnia harmoniczna może być przydatnym substytutem średniej arytmetycznej, gdy nie ma ona żadnych oczekiwań lub nie ma wariancji. Może rzeczywiście być tak, że nie istnieje lub jest nieskończony, podczas gdy E [ 1 / X ] istnieje. Na przykład rozkład Pareto o gęstości f ( x ) = α x α 0mi[X]mi[1/X]nie ma skończonego oczekiwania, gdyα1, co oznacza, że ​​średnia arytmetyczna ma nieskończone oczekiwanie, podczas gdyE[1/X]= x 0 αx α 0

fa(x)=αx0αxα+1jaxx0
α1 co oznacza, że ​​średnia harmoniczna ma skończone oczekiwanie.
mi[1/X]=x0αx0αxα+2)rex=αx0α(α+1)x0α+1=α(α+1)x0

I odwrotnie, istnieją rozkłady, dla których nie ma oczekiwanych średnich harmonicznych, jak na przykład rozkład Beta gdy α 1 . I wiele innych, dla których nie ma wariancji.bmi(α,β)α1

Istnieje również związek z przybliżeniami Monte Carlo do całek, a zwłaszcza stałych normalizujących, opartych na bayesowskiej tożsamości tylnej gdzieφ()jest dowolną gęstością,π()jest pierwiastkiem,L(|x)prawdopodobieństwo, am()jest marginalny, jak omówiono winnym pytaniudotyczącym sprawdzonego X, gdzieI komentujniebezpieczeństwa związane z używaniem tego, co Radford Neal (U Toronto) nazywanajgorszym estymatorem Monte Carlo w historii. (Napisałem równieżkilka wpisówna moim blogu na ten temat.)

mi[φ(θ)π(θ)L.(θ|x)|x]=1m(x)
φ()π()L.(|x)m()
Xi'an
źródło
2
Dlaczego te właściwości są preferowane przy uśrednianiu stawek?
Walrus the Cat
Nie znam wyników optymalizacyjnych, ale posiadanie estymatora o skończonych oczekiwaniach wydaje się lepszym rozwiązaniem niż bez niego!
Xi'an