Pytania oznaczone «pandas»

113

Konwertowanie ciągów na elementy zmiennoprzecinkowe w DataFrame

Jak ukryć kolumnę DataFrame zawierającą ciągi i NaNwartości na zmiennoprzecinkowe . Jest jeszcze jedna kolumna, której wartości są ciągami znaków i liczbami zmiennoprzecinkowymi; jak przekonwertować całą kolumnę na liczby

python pandas

113

Połącz kolumny Data i godzina za pomocą pand w języku Python

Mam ramkę danych pandy z następującymi kolumnami; Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 Jak połączyć dane [„Data”] i...

python pandas datetime series

112

Tworzenie mapy cieplnej z pand DataFrame

Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować mapę cieplną za pomocą DataFrame z pakietu pandy. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index,...

python pandas dataframe heatmap

112

Wstaw wiersz do pandy dataframe

Mam ramkę danych: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] i muszę dodać pierwszy wiersz [2, 3, 4], aby uzyskać: A B C 0 2 3 4 1 5 6 7 2 7 8 9 Próbowałem append()i...

python pandas dataframe insert

112

Zwróć wiele kolumn z pand zastosuj ()

Mam pandy DataFrame, df_test. Zawiera kolumnę „rozmiar”, która reprezentuje rozmiar w bajtach. Obliczyłem KB, MB i GB za pomocą następującego kodu: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] =...

python pandas dataframe apply

111

Python: Konwertuj timedelta na int w ramce danych

Chciałbym utworzyć kolumnę w ramce danych pandy, która jest liczbą całkowitą reprezentującą liczbę dni w kolumnie timedelta. Czy można użyć „datetime.days”, czy też muszę zrobić coś więcej ręcznie? kolumna timedelta 7 dni, 23:29:00 Kolumna z liczbą całkowitą dnia...

python pandas timedelta

111

Kiedy powinienem kiedykolwiek chcieć używać pandy Apply () w moim kodzie?

Widziałem wiele odpowiedzi opublikowanych na pytania dotyczące przepełnienia stosu, w których zastosowano metodę Pandy apply. Widziałem również użytkowników komentujących pod nimi, mówiąc, że „ applyjest powolny i należy go unikać”. Przeczytałem wiele artykułów na temat wydajności, które...

python pandas performance apply

111

Konwertuj nagłówek wiersza na kolumnę dla Pandas DataFrame,

Dane, z którymi muszę pracować, są trochę niechlujne ... Zawiera nazwy nagłówków w swoich danych. Jak mogę wybrać wiersz z istniejącej ramki danych pandy i ustawić go (zmienić jego nazwę na) jako nagłówek kolumny? Chcę zrobić coś takiego: header = df[df['old_header_name1'] ==...

python pandas rename dataframe

111

python pandas dataframe do słownika

Mam dwie kolumny dataframe i zamierzam przekonwertować ją na słownik Pythona - pierwsza kolumna będzie kluczem, a druga będzie wartością. Z góry dziękuję. Ramka danych: id value 0 0 10.2 1 1 5.7 2 2

python dictionary pandas

111

Uruchom regresję OLS z ramką danych Pandas

Mam pandasramkę danych i chciałbym móc przewidzieć wartości kolumny A na podstawie wartości w kolumnach B i C. Oto przykład zabawki: import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40, 50], "C": [32, 234, 23, 23, 42523]}) Najlepiej byłoby, gdybyś miał coś...

python pandas scikit-learn regression statsmodels

111

Jak zwolnić pamięć używaną przez ramkę danych pandy?

Mam naprawdę duży plik csv, który otworzyłem w pandach w następujący sposób .... import pandas df = pandas.read_csv('large_txt_file.txt') Gdy to zrobię, moje użycie pamięci wzrośnie o 2 GB, co jest oczekiwane, ponieważ ten plik zawiera miliony wierszy. Mój problem pojawia się, gdy muszę uwolnić...

python pandas memory

111

Przypisz pandy do typów kolumn dataframe

Chcę ustawić dtypes wielu kolumn w pd.Dataframe(mam plik, który musiałem ręcznie przeanalizować na listę list, ponieważ plik nie był przystosowany pd.read_csv) import pandas as pd print pd.DataFrame([['a','1'],['b','2']], dtype={'x':'object','y':'int'}, columns=['x','y']) dostaję ValueError:...

python pandas

110

Dołączasz listę lub serię do pandy DataFrame jako wiersz?

Dlatego zainicjowałem puste pandy DataFrame i chciałbym iteracyjnie dołączać listy (lub serie) jako wiersze w tej ramce DataFrame. Jaki jest najlepszy sposób na zrobienie

python pandas append dataframe

110

Python Pandy scalają tylko niektóre kolumny

Czy można scalić tylko niektóre kolumny? Mam DataFrame df1 z kolumnami x, y, z i df2 z kolumnami x, a, b, c, d, e, f itd. Chcę połączyć dwie ramki DataFrame na x, ale chcę tylko scalić kolumny df2.a, df2.b - a nie całą ramkę DataFrame. Wynik byłby DataFrame z x, y, z, a, b. Mógłbym scalić, a...

python merge pandas

110

Jak dodać tytuł do wykresu pola morskiego

Wydaje się, że można go znaleźć w Google, ale nie udało mi się znaleźć w Internecie czegoś, co działa. Próbowałem obu sns.boxplot('Day', 'Count', data= gg).title('lalala')i sns.boxplot('Day', 'Count', data= gg).suptitle('lalala'). Żaden nie działał. Myślę, że może to być spowodowane tym, że...

pandas matplotlib seaborn

110

Konwertuj czas uniksowy na czytelną datę w ramce danych pandy

Mam ramkę danych z czasami i cenami uniksowymi. Chcę przekonwertować kolumnę indeksu, aby była wyświetlana w postaci czytelnej dla człowieka. Na przykład mam datejak 1349633705w kolumnie indeksu, ale chciałbym, aby był wyświetlany jako 10/07/2012(lub przynajmniej 10/07/2012 18:15). Dla niektórych...

python pandas unix-timestamp dataframe

110

Porównaj dwie kolumny za pomocą pand

Używając tego jako punktu wyjścia: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Chcę użyć czegoś w rodzaju ifoświadczenia w pandach. if df['one'] >=...

python pandas if-statement dataframe

109

Jak zmienić format daty i godziny w pandach

Moja ramka danych ma DOBkolumnę (przykładowy format 1/1/2016), która jest domyślnie konwertowana na pandas dtype 'object':DOB object Konwersja to format daty df['DOB'] = pd.to_datetime(df['DOB']), data zostanie przekonwertowany do: 2016-01-26a jej dtypebrzmi: DOB datetime64[ns]. Teraz chcę...

python string pandas datetime strftime

109

Jak odczytać plik .xlsx za pomocą biblioteki pandas w iPythonie?

Chcę odczytać plik .xlsx przy użyciu biblioteki Pandas w Pythonie i przenieść dane do tabeli postgreSQL. Do tej pory mogłem tylko: import pandas as pd data = pd.ExcelFile("*File Name*") Teraz wiem, że krok został wykonany pomyślnie, ale chcę wiedzieć, w jaki sposób mogę przeanalizować plik...

python pandas ipython ipython-notebook dataframe

109

pandy: najlepszy sposób na zaznaczenie wszystkich kolumn, których nazwy zaczynają się od X

Mam DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1, 0, 0, 0],...

python pandas dataframe selection