Pytania oznaczone «pandas»

88
Przykładowe zbiory danych w Pandach

Korzystając z języka R, przydatne jest ładowanie „ćwiczeniowych” zestawów danych za pomocą data(iris) lub data(mtcars) Czy jest coś podobnego dla Pand? Wiem, że mogę załadować inną metodą, jestem po prostu ciekawy, czy jest coś wbudowanego.

87
Pandy: jak zmienić wszystkie wartości w kolumnie?

Mam ramkę danych z kolumną o nazwie "Date"i chcę, aby wszystkie wartości z tej kolumny miały tę samą wartość (tylko rok). Przykład: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Chcę: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Oto mój kod: fr61_70xls...

87
wyodrębnianie dni z wartości numpy.timedelta64

Używam pandy / python i mam dwie serie dat s1 i s2, które zostały wygenerowane za pomocą funkcji „to_datetime” w polu df zawierającym daty / godziny. Kiedy odejmuję s1 od s2 s3 = s2 - s1 Otrzymuję serię s3 typu timedelta64 [ns] 0 385 days, 04:10:36 1 57 days, 22:54:00 2 642 days,...

87
Przesunąć kolumnę w ramce danych pand o jeden?

Mam ramkę danych pandy. Chcę „opóźnić” jedną z moich kolumn. Oznacza to, na przykład, przesunięcie całej kolumny „gdp” w górę o jeden, a następnie usunięcie wszystkich nadmiarowych danych na dole pozostałych wierszy, tak aby wszystkie kolumny były znowu równej długości. df = y gdp cap 0 1 2...

87
Jak usunąć kolumnę zawierającą tylko zera w Pandach?

Obecnie mam ramkę danych składającą się z kolumn z 1 i 0 jako wartościami, chciałbym iterować przez kolumny i usuwać te, które składają się tylko z 0. Oto, czego próbowałem do tej pory: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == 1:...

87
Zastosuj funkcję do każdej komórki w DataFrame

Mam ramkę danych, która może wyglądać następująco: A B C foo bar foo bar bar foo foo bar Chcę przejrzeć każdy element każdego wiersza (lub każdy element każdej kolumny) i zastosować następującą funkcję, aby uzyskać kolejny DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar...

86
Podziel dużą ramkę danych pandy

Mam dużą ramkę danych z 423244 liniami. Chcę podzielić to na 4. Próbowałem następującego kodu, który dał błąd?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Jak podzielić tę ramkę danych na 4 grupy?

86
Pandy: konwertuj kategorie na liczby

Załóżmy, że mam ramkę danych z krajami, które są następujące: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Wiem, że istnieje funkcja pd.get_dummies służąca do konwersji krajów na „kodowanie na jeden gorący”. Chciałbym jednak przekonwertować je na indeksy zamiast takich, które otrzymam...