Mam problem z niektórymi funkcjami pand. Jak sprawdzić, jaka jest moja wersja
Mam problem z niektórymi funkcjami pand. Jak sprawdzić, jaka jest moja wersja
Używam notatnika iPython. Kiedy to zrobię: df Dostaję piękny stół z komórkami. Jeśli jednak to zrobię: df1 df2 nie drukuje pierwszego pięknego stołu. Jeśli spróbuję: print df1 print df2 Drukuje tabelę w innym formacie, który rozlewa kolumny i sprawia, że wydruk jest bardzo wysoki. Czy...
Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla countkolumny, po zgrupowaniu według ['Sp','Mt']kolumn? Przykład 1: następujące ramki danych, które grupuję według ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4...
Jeśli mam indeks kolumn wielopoziomowych: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) za --- + - b | do - + --- + - 0 | 1 | 2) 1 | 3 | 4 Jak mogę upuścić poziom „a” tego indeksu, aby uzyskać: b | do - + ---...
Mam jedno pole w pandach DataFrame, które zostało zaimportowane jako format ciągu. Powinna to być zmienna datetime. Jak przekonwertować go na kolumnę daty i godziny, a następnie filtrować według daty. Przykład: DataFrame Name: raw_data Nazwa kolumny: Mycol Format wartości w kolumnie:...
Zamknięte. To pytanie nie jest powtarzalne lub zostało spowodowane literówkami . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte w zeszłym roku . Popraw to pytanie...
Jak mogę czytać w pliku .csv (bez nagłówków) i kiedy chcę tylko podzestawu kolumn (powiedzmy 4 i 7 z 20 kolumn), używając pand? Nie mogę tego
Mam taką ramkę danych: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Jak widać, miesięcy nie...
Na przykład mam prosty DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Czy mogę wybrać wartości z „A”, dla których odpowiadające wartości...
Mam ramkę danych z ~ 300 000 wierszy i ~ 40 kolumnami. Chcę dowiedzieć się, czy którekolwiek wiersze zawierają wartości null - i umieść te wiersze „null” w osobnej ramce danych, aby móc je łatwo przeglądać. Mogę jawnie utworzyć maskę: mask = False for col in df.columns: mask = mask |...
Pracowałem z danymi importowanymi z pliku CSV. Pandy zmieniły niektóre kolumny na zmiennoprzecinkowe, więc teraz liczby w tych kolumnach są wyświetlane jako zmiennoprzecinkowe! Jednak muszę je wyświetlać jako liczby całkowite lub bez przecinka. Czy istnieje sposób przekonwertować je na liczby...
Mam Seriesobiekt pandy zawierający wartości logiczne. Jak mogę uzyskać serię zawierającą logikę NOTkażdej wartości? Rozważmy na przykład serię zawierającą: True True True False Seria, którą chciałbym uzyskać, zawierałaby: False False False True Wydaje się, że powinno to być dość proste, ale...
Mam dwie ramki danych pand, które mają wspólne wiersze. Załóżmy, że ramka danych2 jest podzbiorem ramki danych1. Jak mogę uzyskać wiersze ramki danych 1, których nie ma w ramce danych 2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 =...
Mam ramkę danych w pandach, w których każda kolumna ma inny zakres wartości. Na przykład: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Masz pomysł, jak mogę znormalizować kolumny tej ramki danych, w których każda wartość mieści się w przedziale od 0 do 1? Moje pożądane wyjście to: A B C 1 1...
Odpowiedzi na to pytanie są dziełem społeczności . Edytuj istniejące odpowiedzi, aby poprawić ten post. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Sporo czasu spędziłem na oglądaniu obu r i pandytagi na SO, mam wrażenie, że pandaspytania zawierają mniej...
Mam Dataframe, df, z następującą kolumną: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Elementy kolumny to pandas.tslib.Timestamp. Chcę tylko podać...
W docs pokazują, jak zastosować wiele funkcji w obiekcie GroupBy naraz przy użyciu dict z nazwami kolumn wyjście jako klucze: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588...
jaki jest najszybszy / najprostszy sposób na usunięcie wartości nan i inf / inf z pandy DataFrame bez resetowania mode.use_inf_as_null? Chciałbym móc używać argumentów subseti howargumentów dropna, z wyjątkiem infwartości uważanych za brakujące, takich jak: df.dropna(subset=["col1", "col2"],...
W R, gdy musisz pobrać indeks kolumny na podstawie nazwy kolumny, którą możesz zrobić idx <- which(names(my_data)==my_colum_name) Czy istnieje sposób, aby zrobić to samo z ramkami danych
Mam ramkę danych Pandas, jak pokazano poniżej: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Chcę usunąć wartości NaN z pustym ciągiem, aby wyglądał tak: 1 2 3 0 a "" read 1 b l unread 2 c ""