Pytania oznaczone «pandas»

150
Zastępowanie pustych wartości (spacji) NaN w pandach

Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04...

148
Pandy konwertują ramkę danych na tablicę krotek

Manipulowałem niektórymi danymi za pomocą pand, a teraz chcę wykonać zbiorczy zapis z powrotem do bazy danych. Wymaga to ode mnie przekształcenia ramki danych w tablicę krotek, z których każda odpowiada „wierszowi” ramki danych. Moja DataFrame wygląda mniej więcej tak: In [182]:...

148
Pandy procent całości z grupowaniem

Jest to oczywiście proste, ale jako tępy nowicjusz utknąłem. Mam plik CSV zawierający 3 kolumny, stan, identyfikator biura i sprzedaż dla tego biura. Chcę obliczyć procent sprzedaży na biuro w danym stanie (suma wszystkich procentów w każdym stanie to 100%). df = pd.DataFrame({'state': ['CA',...

147
pandy pythonowe: zastosuj funkcję z argumentami do serii

Chcę zastosować funkcję z argumentami do serii w pandach Pythona: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... Dokumentacja opisuje wsparcie dla zastosowania metody, ale nie przyjmuje żadnych argumentów. Czy istnieje inna metoda, która...

146
Jak zapętlić zgrupowaną ramkę danych Pandas?

Ramka danych: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Kod: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Próbuję po prostu zapętlić zagregowane dane, ale pojawia się...

144
Czytanie pliku Excela w Pythonie za pomocą pand

Próbuję odczytać plik Excela w ten sposób: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) co powoduje wyświetlenie błędu informującego o oczekiwaniu dwóch argumentów. Nie wiem, jaki jest drugi argument, a także to, co próbuję tutaj osiągnąć, to...

144
pandy unikalne wartości wielu kolumn

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Jaki jest najlepszy sposób na zwrócenie unikatowych wartości „Col1” i „Col2”? Żądane wyjście to 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'...

143
Modyfikowanie podzbioru wierszy w ramce danych pandy

Załóżmy, że mam pandę DataFrame z dwiema kolumnami, A i B. Chciałbym zmodyfikować tę ramkę DataFrame (lub utworzyć kopię), aby B zawsze miało wartość NaN, gdy A wynosi 0. Jak mogę to osiągnąć? Wypróbowałem następujące df['A'==0]['B'] =

143
JSON do pandy DataFrame

To, co próbuję zrobić, to wyodrębnić dane wysokości z interfejsu API map Google wzdłuż ścieżki określonej przez współrzędne szerokości i długości geograficznej w następujący sposób: from urllib2 import Request, urlopen import json path1 =

143
ImportError: Żaden moduł o nazwie dateutil.parser

Podczas importowania pandasdo Pythonprogramu otrzymuję następujący błąd monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning...