Czy istnieje sposób na usunięcie wartości NaN z serii pandy? Mam serię, która może zawierać pewne wartości NaN lub nie, i chciałbym zwrócić kopię serii z usuniętymi wszystkimi NaN.
Czy istnieje sposób na usunięcie wartości NaN z serii pandy? Mam serię, która może zawierać pewne wartości NaN lub nie, i chciałbym zwrócić kopię serii z usuniętymi wszystkimi NaN.
Chciałbym mieć logiczny operator OR oparty na elementach. Wiem, że samo „lub” nie jest tym, czego szukam. Zdaję sobie sprawę, że i odpowiada &, a nie ~. Ale co z OR?
Mam obiekt Python Pandas DataFramezawierający dane tekstowe. Mój problem polega na tym, że kiedy używamto_html() funkcji, obcina ona ciągi w danych wyjściowych. Na przykład: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print...
Kiedy używasz tego w skrypcie (nie IPythonie), nic się nie dzieje, tj. Okno wykresu nie pojawia się: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Nawet przy dodawaniu time.sleep(5)wciąż nic nie ma....
Zamknięte . To pytanie jest oparte na opinii . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby można było na nie odpowiedzieć, podając fakty i cytaty, edytując ten post . Zamknięte 4 lata temu . Popraw to...
Używam ramek danych Pandas i chcę utworzyć nową kolumnę jako funkcję istniejących kolumn. Nie widziałem dobrej dyskusji na temat różnicy prędkości między df.apply()i np.vectorize(), więc pomyślałem, że zapytam tutaj. Funkcja Pandy apply()jest powolna. Z tego, co zmierzyłem (pokazane poniżej w...
Czy istnieje sposób na napisanie funkcji agregującej, która jest używana w DataFrame.aggmetodzie, która miałaby dostęp do więcej niż jednej kolumny danych, które są agregowane? Typowymi przypadkami użycia byłyby średnie ważone funkcje odchylenia standardowego. Chciałbym móc napisać coś...
Czy istnieje metoda zastępowania wartości Nonew Pandas w Pythonie? Możesz użyć df.replace('pre', 'post')i zastąpić wartość inną, ale nie można tego zrobić, jeśli chcesz zastąpić Nonewartość, co jeśli spróbujesz, otrzymasz dziwny wynik. Oto przykład: df =
Czyszczenie wartości ramki danych typu multitype w python / pandas, chcę przyciąć ciągi. Obecnie robię to w dwóch instrukcjach: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True,...
Próbuję zrobić coś dość prostego, wczytując duży plik csv do ramki danych pandy. data = pandas.read_csv(filepath, header = 0, sep = DELIMITER,skiprows = 2) Kod albo kończy się niepowodzeniem MemoryError, albo po prostu nigdy się nie kończy. Użycie pamięci w menedżerze zadań zatrzymało się na...
Większość funkcji Numpy domyślnie włącza wielowątkowość. na przykład pracuję na 8-rdzeniowej stacji roboczej z procesorem Intel, jeśli uruchomię skrypt import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Linux topwyświetli 800% użycia procesora podczas pracy, co...
Mam ramkę danych i słownik. Muszę dodać nową kolumnę do ramki danych i obliczyć jej wartości na podstawie słownika. Uczenie maszynowe, dodanie nowej funkcji opartej na niektórych tabelach: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, 1, 0, 1, 1, 0, 0,...
Mam takiego df: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) I lista przedmiotów: letters = ['a','c'] Moim celem jest, aby wszystkie wiersze framezawierały co najmniej 2 elementyletters Wymyśliłem to rozwiązanie: for i in letters: subframe =
Mam ramkę danych, która rejestruje odpowiedzi 19717 osób na wybór języków programowania za pomocą pytań wielokrotnego wyboru. Pierwsza kolumna to oczywiście płeć respondenta, a reszta to wybory, które wybrali. Dlatego jeśli wybiorę Python, moja odpowiedź zostanie zapisana w kolumnie Python, a nie...
Mam dwie pandasramki danych ai b: a1 a2 a3 a4 a5 a6 a7 1 3 4 5 3 4 5 0 2 0 3 0 2 1 2 5 6 5 2 1 2 i b1 b2 b3 b4 b5 b6 b7 3 5 4 5 1 4 3 0 1 2 3 0 0 2 2 2 1 5 2 6 5 Dwie ramki danych zawierają dokładnie te same dane, ale w innej kolejności i przy różnych nazwach kolumn. Na podstawie liczb w...
Pracuję z pojedynczymi wierszami ramek danych pand, ale natrafiam na problemy z przymusem podczas indeksowania i wstawiania wierszy. Wydaje się, że Pandy zawsze chcą wymuszać mieszane typy int / float na all-float i nie widzę żadnych oczywistych kontroli tego zachowania. Na przykład tutaj jest...
Jeśli masz ramkę danych Pandas taką jak ta: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Ale mając...
Mam następującą ramkę danych pand: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Próbuję utworzyć słownik hierarchiczny z wartościami osadzonego słownika w postaci list,...
from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # 85 9 4 # 86 9...
Mam ogromną ramkę danych z wieloma kolumnami, z których wiele jest typu datetime.datetime. Problem polega na tym, że wiele z nich ma również typy mieszane, w tym na przykład datetime.datetimewartości i Nonewartości (i potencjalnie inne nieprawidłowe wartości): 0 2017-07-06 00:00:00 1 2018-02-27...