Pytania oznaczone «pandas»

81
Usuń NaN z serii pand

Czy istnieje sposób na usunięcie wartości NaN z serii pandy? Mam serię, która może zawierać pewne wartości NaN lub nie, i chciałbym zwrócić kopię serii z usuniętymi wszystkimi NaN.

81
Pandy to_html () obcina zawartość ciągu

Mam obiekt Python Pandas DataFramezawierający dane tekstowe. Mój problem polega na tym, że kiedy używamto_html() funkcji, obcina ona ciągi w danych wyjściowych. Na przykład: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print...

81
Fabuła Pand nie jest wyświetlana

Kiedy używasz tego w skrypcie (nie IPythonie), nic się nie dzieje, tj. Okno wykresu nie pojawia się: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Nawet przy dodawaniu time.sleep(5)wciąż nic nie ma....

80
Funkcja agregująca Pandas DataFrame korzystająca z wielu kolumn

Czy istnieje sposób na napisanie funkcji agregującej, która jest używana w DataFrame.aggmetodzie, która miałaby dostęp do więcej niż jednej kolumny danych, które są agregowane? Typowymi przypadkami użycia byłyby średnie ważone funkcje odchylenia standardowego. Chciałbym móc napisać coś...

79
Błąd pamięci podczas korzystania z pand read_csv

Próbuję zrobić coś dość prostego, wczytując duży plik csv do ramki danych pandy. data = pandas.read_csv(filepath, header = 0, sep = DELIMITER,skiprows = 2) Kod albo kończy się niepowodzeniem MemoryError, albo po prostu nigdy się nie kończy. Użycie pamięci w menedżerze zadań zatrzymało się na...

25
Dziwny błąd w Pandach i Numpy dotyczący wielowątkowości

Większość funkcji Numpy domyślnie włącza wielowątkowość. na przykład pracuję na 8-rdzeniowej stacji roboczej z procesorem Intel, jeśli uruchomię skrypt import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Linux topwyświetli 800% użycia procesora podczas pracy, co...

16
Jak przekonwertować ramkę danych pandy na słownik hierarchiczny

Mam następującą ramkę danych pand: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Próbuję utworzyć słownik hierarchiczny z wartościami osadzonego słownika w postaci list,...

15
Znajdź szybko pary symetryczne w numpy

from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # 85 9 4 # 86 9...

14
Ustal, które kolumny są datetime

Mam ogromną ramkę danych z wieloma kolumnami, z których wiele jest typu datetime.datetime. Problem polega na tym, że wiele z nich ma również typy mieszane, w tym na przykład datetime.datetimewartości i Nonewartości (i potencjalnie inne nieprawidłowe wartości): 0 2017-07-06 00:00:00 1 2018-02-27...