Zastanawiam się, jaka jest wewnętrzna wartość stosowania średniej harmonicznej (na przykład do obliczania miar F), a nie ważonej średniej arytmetycznej w łączeniu precyzji i przypominania? Myślę, że ważona średnia arytmetyczna może odgrywać rolę średniej harmonicznej, czy coś mi brakuje?
12
Odpowiedzi:
Ogólnie rzecz biorąc, środki harmoniczne są preferowane, gdy próbuje się uśrednić stawki zamiast liczb całkowitych. W przypadku miary F1 średnia harmoniczna będzie karać bardzo małe dokładności lub przywołania, podczas gdy nieważona średnia arytmetyczna nie. Wyobraź sobie uśrednienie 100% i 0%: średnia arytmetyczna wynosi 50%, a średnia harmoniczna 0%. Średnia harmoniczna wymaga, aby zarówno precyzja, jak i przywoływanie były wysokie.
Ponadto, gdy precyzja i przywołanie są blisko siebie, średnia harmoniczna będzie bliska średniej arytmetycznej. Przykład: średnia harmoniczna 95% i 90% wynosi 92,4% w porównaniu ze średnią arytmetyczną 92,5%.
To, czy jest to pożądana właściwość, zależy prawdopodobnie od przypadku użycia, ale zazwyczaj jest uważane za dobre.
Na koniec zauważ, że, jak stwierdził @whuber w komentarzach, średnia harmoniczna jest rzeczywiście ważoną średnią arytmetyczną.
źródło
Średnia harmoniczna może być przydatnym substytutem średniej arytmetycznej, gdy nie ma ona żadnych oczekiwań lub nie ma wariancji. Może rzeczywiście być tak, że nie istnieje lub jest nieskończony, podczas gdy E [ 1 / X ] istnieje. Na przykład rozkład Pareto o gęstości f ( x ) = α x α 0E [X] E [1 / X] nie ma skończonego oczekiwania, gdyα≤1, co oznacza, że średnia arytmetyczna ma nieskończone oczekiwanie, podczas gdyE[1/X]=∫∞ x 0 αx α 0
I odwrotnie, istnieją rozkłady, dla których nie ma oczekiwanych średnich harmonicznych, jak na przykład rozkład Beta gdy α ≤ 1 . I wiele innych, dla których nie ma wariancji.be ( α , β) α ≤ 1
Istnieje również związek z przybliżeniami Monte Carlo do całek, a zwłaszcza stałych normalizujących, opartych na bayesowskiej tożsamości tylnej gdzieφ(⋅)jest dowolną gęstością,π(⋅)jest pierwiastkiem,L(⋅|x)prawdopodobieństwo, am(⋅)jest marginalny, jak omówiono winnym pytaniudotyczącym sprawdzonego X, gdzieI komentujniebezpieczeństwa związane z używaniem tego, co Radford Neal (U Toronto) nazywanajgorszym estymatorem Monte Carlo w historii. (Napisałem równieżkilka wpisówna moim blogu na ten temat.)
źródło