Pytania oznaczone «pandas»

112
Tworzenie mapy cieplnej z pand DataFrame

Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować mapę cieplną za pomocą DataFrame z pakietu pandy. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index,...

112
Wstaw wiersz do pandy dataframe

Mam ramkę danych: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] i muszę dodać pierwszy wiersz [2, 3, 4], aby uzyskać: A B C 0 2 3 4 1 5 6 7 2 7 8 9 Próbowałem append()i...

112
Zwróć wiele kolumn z pand zastosuj ()

Mam pandy DataFrame, df_test. Zawiera kolumnę „rozmiar”, która reprezentuje rozmiar w bajtach. Obliczyłem KB, MB i GB za pomocą następującego kodu: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] =...

111
Python: Konwertuj timedelta na int w ramce danych

Chciałbym utworzyć kolumnę w ramce danych pandy, która jest liczbą całkowitą reprezentującą liczbę dni w kolumnie timedelta. Czy można użyć „datetime.days”, czy też muszę zrobić coś więcej ręcznie? kolumna timedelta 7 dni, 23:29:00 Kolumna z liczbą całkowitą dnia...

111
Jak zwolnić pamięć używaną przez ramkę danych pandy?

Mam naprawdę duży plik csv, który otworzyłem w pandach w następujący sposób .... import pandas df = pandas.read_csv('large_txt_file.txt') Gdy to zrobię, moje użycie pamięci wzrośnie o 2 GB, co jest oczekiwane, ponieważ ten plik zawiera miliony wierszy. Mój problem pojawia się, gdy muszę uwolnić...

111
Przypisz pandy do typów kolumn dataframe

Chcę ustawić dtypes wielu kolumn w pd.Dataframe(mam plik, który musiałem ręcznie przeanalizować na listę list, ponieważ plik nie był przystosowany pd.read_csv) import pandas as pd print pd.DataFrame([['a','1'],['b','2']], dtype={'x':'object','y':'int'}, columns=['x','y']) dostaję ValueError:...

110
Python Pandy scalają tylko niektóre kolumny

Czy można scalić tylko niektóre kolumny? Mam DataFrame df1 z kolumnami x, y, z i df2 z kolumnami x, a, b, c, d, e, f itd. Chcę połączyć dwie ramki DataFrame na x, ale chcę tylko scalić kolumny df2.a, df2.b - a nie całą ramkę DataFrame. Wynik byłby DataFrame z x, y, z, a, b. Mógłbym scalić, a...

110
Jak dodać tytuł do wykresu pola morskiego

Wydaje się, że można go znaleźć w Google, ale nie udało mi się znaleźć w Internecie czegoś, co działa. Próbowałem obu sns.boxplot('Day', 'Count', data= gg).title('lalala')i sns.boxplot('Day', 'Count', data= gg).suptitle('lalala'). Żaden nie działał. Myślę, że może to być spowodowane tym, że...

110
Porównaj dwie kolumny za pomocą pand

Używając tego jako punktu wyjścia: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Chcę użyć czegoś w rodzaju ifoświadczenia w pandach. if df['one'] >=...