Nie mogę uzyskać średniej lub średniej kolumny w pandach. Mają ramkę danych. Żadna z rzeczy, które wypróbowałem poniżej, nie daje mi średniej z kolumnyweight
>>> allDF
ID birthyear weight
0 619040 1962 0.1231231
1 600161 1963 0.981742
2 25602033 1963 1.3123124
3 624870 1987 0.94212
Poniższe zwraca kilka wartości, a nie jedną:
allDF[['weight']].mean(axis=1)
Czyli to:
allDF.groupby('weight').mean()
df.groupby('weight')
nie był tym, czego chciałeś, ponieważ podzielił df na oddzielne kolumny, każda z inną wartością wagi. Zamiast po prostudf['weight'].mean()
Odpowiedzi:
Jeśli chcesz tylko średnią z
weight
kolumny, wybierz kolumnę (która jest serią) i wywołaj.mean()
:źródło
Spróbuj
df.mean(axis=0)
,axis=0
argument oblicza średnią kolumnową ramki danych, więc wynik będzieaxis=1
średnią wierszową, więc otrzymujesz wiele wartości.źródło
Spróbuj dać
print (df.describe())
szansę. Mam nadzieję, że uzyskanie ogólnego opisu ramki danych będzie bardzo pomocne.źródło
display(df.describe())
jest lepszy (w notebookach Jupyter), ponieważdisplay
ipython zapewnia sformatowany HTML zamiast ASCII, co jest bardziej przydatne wizualnie / przyjemne.możesz użyć
otrzymasz podstawowe statystyki ramki danych i średnią z określonej kolumny, której możesz użyć
źródło
Możesz również uzyskać dostęp do kolumny za pomocą notacji z kropkami (nazywanej również dostępem do atrybutów), a następnie obliczyć jej średnią:
źródło
Średnia dla każdej kolumny w
df
:a jeśli chcesz średnią ze wszystkich kolumn:
źródło
Dodatkowo, jeśli chcesz uzyskać
round
wartość po znalezieniumean
.źródło
Możesz użyć jednego z dwóch poniższych stwierdzeń:
źródło
źródło
Możesz po prostu przejść do: df.describe (), która dostarczy Ci wszystkich istotnych informacji, których potrzebujesz, ale aby znaleźć minimalną, maksymalną lub średnią wartość danej kolumny (powiedz „wagi” w twoim przypadku), użyj:
źródło