Pytania oznaczone «pandas»

97
Łączna liczba pand jest różna

Powiedzmy, że mam dziennik aktywności użytkowników i chcę wygenerować raport o łącznym czasie trwania i liczbie unikalnych użytkowników dziennie. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id':...

96
Znajdź indeks całkowity wierszy z NaN w ramce danych pandy

Mam takie pandy DataFrame: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665...

96
Usuwanie wielu kolumn na podstawie nazw kolumn w Pandas

Mam trochę danych i kiedy je importuję, otrzymuję następujące niepotrzebne kolumny Szukam łatwego sposobu na usunięcie ich wszystkich 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33',...

96
Jaka jest różnica między pandas.qcut i pandas.cut?

Dokumentacja mówi: http://pandas.pydata.org/pandas-docs/dev/basics.html „Wartości ciągłe można dyskretyzować za pomocą funkcji cut (pojemniki oparte na wartościach) i qcut (pojemniki oparte na kwantylach próbek)” Brzmi dla mnie bardzo abstrakcyjnie ... Widzę różnice w poniższym przykładzie,...

95
Jak rozbić listę w komórce Dataframe na oddzielne wiersze

Chcę zamienić komórkę pandy zawierającą listę w wiersze dla każdej z tych wartości. Więc weź to: Jeśli chciałbym rozpakować i ułożyć wartości w nearest_neighborskolumnie, tak aby każda wartość była wierszem w każdym opponentindeksie, jak najlepiej się do tego zabrać? Czy istnieją metody...

93
Duży, trwały DataFrame w pandach

Odkrywam przejście na Pythona i pandy jako wieloletni użytkownik SAS. Jednak podczas dzisiejszego przeprowadzania niektórych testów byłem zaskoczony, że Pythonowi zabrakło pamięci podczas próby pandas.read_csv()pliku CSV o wielkości 128 MB. Miał około 200 000 wierszy i 200 kolumn zawierających...

93
Scalanie pand - jak uniknąć powielania kolumn

Próbuję połączyć dwie ramki danych. Każda ramka danych ma dwa poziomy indeksu (data, cusip). Na przykład niektóre kolumny w kolumnach pasują do tych dwóch (waluta, data dostosowania). Jaki jest najlepszy sposób na scalenie ich według indeksu, ale nie należy brać dwóch kopii waluty i daty...

93
Grupa pandy według sumy łącznej

Chciałbym dodać skumulowaną kolumnę sumy do mojej ramki danych Pandas, aby: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 staje się: Jack | Monday | 10 | 10 Jack | Tuesday | 30...