Obliczanie średniej arytmetycznej (jeden typ średniej) w Pythonie

267

Czy w Pythonie jest wbudowana lub standardowa metoda biblioteczna do obliczania średniej arytmetycznej (jeden typ średniej) z listy liczb?

python math statistics average mean jrdioko
źródło

Średnia jest dwuznaczna - tryb i mediana są również często używanymi średnimi

jtlz2

Tryb i mediana to inne miary tendencji centralnej. Nie są to średnie. Tryb ten jest najczęściej spotykaną wartością w zestawie danych i niekoniecznie jest unikalny. Mediana to wartość reprezentująca środek punktów danych. Jak sugeruje to pytanie, istnieje kilka różnych typów średnich, ale wszystkie różnią się od obliczeń mediany i trybu. purplemath.com/modules/meanmode.htm

Jarom

@Jarom Ten link nie zgadza się z tobą: „Średnia, mediana i tryb to trzy rodzaje„ średnich ”

Marcelo Cantos

284

Nic nie wiem w standardowej bibliotece. Możesz jednak użyć czegoś takiego:

def mean(numbers):
    return float(sum(numbers)) / max(len(numbers), 1)

>>> mean([1,2,3,4])
2.5
>>> mean([])
0.0

W numpy jest numpy.mean().

NPE
źródło

20

Powszechną rzeczą jest uznanie, że średnia []to 0, co można zrobić float(sum(l))/max(len(l),1).

yo „

8

PEP 8 mówi, że ljest to zła nazwa zmiennej, ponieważ tak bardzo przypomina 1. Również wolałbym użyć if lniż if len(l) > 0. Zobacz tutaj

zondo,

1

Dlaczego dzwoniłeś max?

1 -_-

3

Zobacz pytanie powyżej: Aby uniknąć dzielenia przez zero (dla [])

Simon Fakir

5

Puste listy nie mają znaczenia. Proszę, nie udawaj, że tak.

Marcelo Cantos,

193

NumPy ma numpy.meanśrednią arytmetyczną. Użycie jest tak proste:

>>> import numpy
>>> a = [1, 2, 4]
>>> numpy.mean(a)
2.3333333333333335

Bengt
źródło

6

numpy to koszmar do zainstalowania w virtualenv. Naprawdę powinieneś rozważyć nieużywanie tego lib

vcarel

46

@vcarel: „numpy to koszmar do zainstalowania w virtualenv”. Nie jestem pewien, dlaczego to mówisz. Kiedyś tak było, ale przez ostatni rok lub dłużej było to bardzo łatwe.

6

Muszę poprzeć ten komentarz. Obecnie używam numpy w virtualenv w OSX i absolutnie nie ma problemu (obecnie używam CPython 3.5).

Juan Carlos Coto

4

W systemach ciągłej integracji, takich jak Travis CI, instalacja numpy zajmuje kilka dodatkowych minut. Jeśli szybka i lekka kompilacja jest dla Ciebie cenna i potrzebujesz tylko środka, zastanów się.

Akseli Palén,

2

@ Środowiska wirtualne AkseliPalén w Travis CI mogą korzystać z numpy zainstalowanego przez apt-get przy użyciu pakietów witryny systemowej . Może być wystarczająco szybki do użycia, nawet jeśli ktoś potrzebuje tylko środka.

Bengt,

184

Użyj statistics.mean:

import statistics
print(statistics.mean([1,2,4])) # 2.3333333333333335

Jest dostępny od wersji Python 3.4. Dla użytkowników 3.1-3.3 stara wersja modułu jest dostępna w PyPI pod nazwą stats. Po prostu zmień statisticsna stats.

kirbyfan64sos
źródło

2

Zauważ, że jest to bardzo wolne w porównaniu do innych rozwiązań. Porównać timeit("numpy.mean(vec)), timeit("sum(vec)/len(vec)")i timeit("statistics.mean(vec)")- ten ostatni jest wolniejszy niż inni przez ogromny czynnik (> 100 w niektórych przypadkach na moim komputerze). Wydaje się, że wynika to ze szczególnie precyzyjnej implementacji sumoperatora statistics, patrz PEP i Kodeks . Nie jestem jednak pewien przyczyny dużej różnicy wydajności między statistics._sumi numpy.sum.

jhin

10

@jhin to dlatego, że statistics.meanpróbuje być poprawny . Oblicza poprawnie średnią [1e50, 1, -1e50] * 1000.

Antti Haapala

1

statistics.meanzaakceptuje również generator wartości wyrażenia, na którym dławią się wszystkie rozwiązania stosowane len()dla dzielnika.

PaulMcG

54

Nie potrzebujesz nawet numpy ani scipy ...

>>> a = [1, 2, 3, 4, 5, 6]
>>> print(sum(a) / len(a))
3

Mumon
źródło

24

wtedy średnia ([2,3]) dałaby 2. uważaj na zmiennoprzecinkowe. Lepsze użycie float (suma (l)) / len (l). Jeszcze lepiej, uważaj, aby sprawdzić, czy lista jest pusta.

jesusiniesta

14

@jesusiniesta, z wyjątkiem python3, gdzie podział wykonuje to, co powinien: divide

yota

11

A w Python 2.2+, jeśli jesteś from __future__ import divisionna szczycie swojego programu

spiffytech

Co z dużymi liczbami i przepełnieniem?

obayhan

Co a = list()? Proponowany kod powoduje ZeroDivisionError.

Ioannis Filippidis

8

Użyj scipy:

import scipy;
a=[1,2,4];
print(scipy.mean(a));

Elendurwen
źródło

37

scipy.stats.mean jest przestarzały; zaktualizuj kod, aby używał numpy.mean.

Bengt,

7

Zamiast rzucać na spławik, możesz wykonać następujące czynności

def mean(nums):
    return sum(nums, 0.0) / len(nums)

lub za pomocą lambda

mean = lambda nums: sum(nums, 0.0) / len(nums)

AKTUALIZACJE: 15.12.2019

Python 3.8 dodał funkcję fmean do modułu statystyk . Co jest szybsze i zawsze zwraca liczbę zmiennoprzecinkową.

Konwertuj dane na zmiennoprzecinkowe i oblicz średnią arytmetyczną.

Działa to szybciej niż funkcja mean () i zawsze zwraca liczbę zmiennoprzecinkową. Dane mogą być sekwencją lub iterowalne. Jeśli wejściowy zestaw danych jest pusty, wywołuje błąd StatisticsError.

fmean ([3.5, 4.0, 5.25])

4.25

Nowości w wersji 3.8.

Vlad Bezden
źródło

2

from statistics import mean
avarage=mean(your_list)

na przykład

from statistics import mean

my_list=[5,2,3,2]
avarage=mean(my_list)
print(avarage)

i wynik jest

3.0

fariborz najafi
źródło

1

def avg(l):
    """uses floating-point division."""
    return sum(l) / float(len(l))

Przykłady:

l1 = [3,5,14,2,5,36,4,3]
l2 = [0,0,0]

print(avg(l1)) # 9.0
print(avg(l2)) # 0.0

jasonleonhard
źródło

1

def list_mean(nums):
    sumof = 0
    num_of = len(nums)
    mean = 0
    for i in nums:
        sumof += i
    mean = sumof / num_of
    return float(mean)

Muhoza yves
źródło

0

Zawsze przypuszczałem, że avgjest pominięty w wbudowanym / stdlib, ponieważ jest tak prosty jak

sum(L)/len(L) # L is some list

a wszelkie zastrzeżenia zostaną już uwzględnione w kodzie dzwoniącym do użytku lokalnego .

Ważne zastrzeżenia:

wynik bez liczby zmiennoprzecinkowej: w python2 9/4 to 2. w celu rozwiązania, użycia float(sum(L))/len(L)lubfrom __future__ import division

dzielenie przez zero: lista może być pusta. rozwiązać:

if not L:
    raise WhateverYouWantError("foo")
avg = float(sum(L))/len(L)

n611x007
źródło

0

Prawidłowa odpowiedź na twoje pytanie to użycie statistics.mean. Ale dla zabawy, oto wersja środka, która nie korzysta z len()funkcji, więc (podobnie jak statistics.mean) może być używana w generatorach, które nie obsługują len():

from functools import reduce
from operator import truediv
def ave(seq):
    return truediv(*reduce(lambda a, b: (a[0] + b[1], b[0]), 
                           enumerate(seq, start=1), 
                           (0, 0)))

PaulMcG
źródło

-2

Inni już opublikowali bardzo dobre odpowiedzi, ale niektórzy ludzie mogą nadal szukać klasycznego sposobu na znalezienie Mean (avg), więc tutaj zamieszczam (kod przetestowany w Pythonie 3.6):

def meanmanual(listt):

mean = 0
lsum = 0
lenoflist = len(listt)

for i in listt:
    lsum += i

mean = lsum / lenoflist
return float(mean)

a = [1, 2, 3, 4, 5, 6]
meanmanual(a)

Answer: 3.5

Hashmatullah Noorzai
źródło

Obliczanie średniej arytmetycznej (jeden typ średniej) w Pythonie

Odpowiedzi:

Przykłady: