Czy jest coś istotnego w średniej geometrycznej i średniej arytmetycznej, które są bardzo blisko siebie, powiedzmy ~ 0,1%? Jakie są domysły na temat takiego zbioru danych?
Pracowałem nad analizą zestawu danych i zauważam, że jak na ironię wartości są bardzo, bardzo bliskie. Nie do końca, ale blisko. Szybka kontrola rozsądności arytmetycznej nierówności średniej geometrycznej oraz przegląd akwizycji danych ujawniają, że nie ma nic podejrzanego w integralności mojego zbioru danych pod względem tego, jak wymyśliłem wartości.
descriptive-statistics
mean
geometric-mean
użytkownik12289
źródło
źródło
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363
Odpowiedzi:
Średnia arytmetyczna jest powiązana ze średnią geometryczną poprzez nierówność średnią arytmetyczną-średnią geometryczną (AMGM), która stwierdza, że:
gdzie osiągnięta jest równość iff . Prawdopodobnie więc twoje punkty danych są bardzo blisko siebie.x1=x2=⋯=xn
źródło
Opracowując odpowiedź @Alex R, jednym ze sposobów dostrzeżenia nierówności AMGM jest efekt nierówności Jensena. Według nierówności Jensena : Następnie weź wykładniczy z obu stron: 1
Prawa strona jest średnią geometryczną, ponieważ(x1⋅x2⋅…⋅xn)1/n=exp(1n∑ilogxi)
Kiedy nierówności AMGM utrzymują się na niemal równym poziomie? Kiedy efekt nierówności Jensena jest niewielki. To, co napędza tutaj efekt nierówności Jensena, to wklęsłość, krzywizna logarytmu. Jeśli twoje dane są rozproszone w obszarze, w którym logarytm ma krzywiznę, efekt będzie duży. Jeśli dane są rozproszone w regionie, w którym logarytm jest zasadniczo afiniczny, efekt będzie niewielki.
Na przykład, jeśli dane mają niewielką zmienność, są zlepione w wystarczająco małym sąsiedztwie, wówczas logarytm będzie wyglądał jak funkcja afiniczna w tym regionie (temat rachunku różniczkowego jest taki, że jeśli powiększysz wystarczająco płynnie, ciągłą funkcję, to będzie to wyglądać jak linia). W przypadku danych wystarczająco blisko siebie średnia arytmetyczna danych będzie zbliżona do średniej geometrycznej.
źródło
Zbadajmy zakres biorąc pod uwagę, że ich średnia arytmetyczna (AM) jest małą wielokrotnością 1 + δ ich średniej geometrycznej (GM) (z δ ≥ 0 ). W pytaniu δ ≈ 0,001, ale nie wiemy n .x1≤x2≤⋯≤xn 1+δ δ≥0 δ≈0.001 n
Ponieważ stosunek tych średnich nie zmienia się po zmianie jednostek miary, wybierz jednostkę, dla której GM wynosi . Zatem staramy się maksymalizować x n z zastrzeżeniem, że x 1 + x 2 + ⋯ + x n = n ( 1 + δ ) i x 1 ⋅ x 2 ⋯ x n = 1 .1 xn x1+x2+⋯+xn=n(1+δ) x1⋅x2⋯xn=1
Zostanie to wykonane przez utworzenie , powiedzmy, i x n = z ≥ x . A zatemx1=x2=⋯=xn−1=x xn=z≥x
i
Rozwiązanie jest pierwiastkiem między 0 a 1 zx 0 1
Łatwo go znaleźć iteracyjnie. Tutaj wykresy optymalnego i Z w funkcji hemibursztynianu dla n = 6 , 20 , 50 , 150 , od lewej do prawej:x z δ n=6,20,50,150
Tak szybko, jak osiąga się każdy znaczący rozmiar nawet mały stosunek 1.001 jest zgodne z jednym dużym oddalonej X n (górne krzywe) i czerwony grupy szczelnie klastra x ı (niższe krzywe) niebieskim.n 1.001 xn xi
Z drugiej strony załóżmy, że jest parzyste (dla uproszczenia). Minimalny zakres uzyskuje się, gdy połowa x i równa jeden x ≤ 1 , a druga połowa jest równa inną wartość Z ≥ 1 . Teraz jest rozwiązanie (które można łatwo sprawdzić)n=2k xi x≤1 z≥1
W przypadku malutkiego możemy zignorować δ 2 jako przybliżenie, a także przybliżać k- ty pierwiastek do pierwszego rzędu, dającδ δ2 kth
Zakres wynosi około .32δ−−−√/n
źródło