Pytania oznaczone «pandas»

251

Mam problem z niektórymi funkcjami pand. Jak sprawdzić, jaka jest moja wersja

python pandas

245

Pokaż DataFrame jako tabelę w iPython Notebook

Używam notatnika iPython. Kiedy to zrobię: df Dostaję piękny stół z komórkami. Jeśli jednak to zrobię: df1 df2 nie drukuje pierwszego pięknego stołu. Jeśli spróbuję: print df1 print df2 Drukuje tabelę w innym formacie, który rozlewa kolumny i sprawia, że wydruk jest bardzo wysoki. Czy...

pandas printing ipython-notebook jupyter-notebook display

244

Uzyskaj wiersze, które mają maksymalną liczbę w grupach za pomocą groupby

Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla countkolumny, po zgrupowaniu według ['Sp','Mt']kolumn? Przykład 1: następujące ramki danych, które grupuję według ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk **8** 4...

python pandas max pandas-groupby

242

Pandy: upuścić poziom z wielopoziomowego indeksu kolumny?

Jeśli mam indeks kolumn wielopoziomowych: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) za --- + - b | do - + --- + - 0 | 1 | 2) 1 | 3 | 4 Jak mogę upuścić poziom „a” tego indeksu, aby uzyskać: b | do - + ---...

python pandas

241

Konwertuj kolumnę Pandy na DateTime

Mam jedno pole w pandach DataFrame, które zostało zaimportowane jako format ciągu. Powinna to być zmienna datetime. Jak przekonwertować go na kolumnę daty i godziny, a następnie filtrować według daty. Przykład: DataFrame Name: raw_data Nazwa kolumny: Mycol Format wartości w kolumnie:...

python datetime pandas

239

Dlaczego moja funkcja „Zastosuj” Pandy nie działa w przypadku wielu kolumn? [Zamknięte]

Zamknięte. To pytanie nie jest powtarzalne lub zostało spowodowane literówkami . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte w zeszłym roku . Popraw to pytanie...

python python-2.7 pandas dataframe apply

238

Pandy czytane w tabeli bez nagłówków

Jak mogę czytać w pliku .csv (bez nagłówków) i kiedy chcę tylko podzestawu kolumn (powiedzmy 4 i 7 z 20 kolumn), używając pand? Nie mogę tego

python pandas

237

jak posortować ramkę danych pand z jednej kolumny

Mam taką ramkę danych: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Jak widać, miesięcy nie...

python pandas sorting

234

Wybieranie za pomocą złożonych kryteriów z pandas.DataFrame

Na przykład mam prosty DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Czy mogę wybrać wartości z „A”, dla których odpowiadające wartości...

python pandas

233

Jak wybrać wiersze z co najmniej jedną wartością null z pandy DataFrame bez jawnego wyświetlania kolumn?

Mam ramkę danych z ~ 300 000 wierszy i ~ 40 kolumnami. Chcę dowiedzieć się, czy którekolwiek wiersze zawierają wartości null - i umieść te wiersze „null” w osobnej ramce danych, aby móc je łatwo przeglądać. Mogę jawnie utworzyć maskę: mask = False for col in df.columns: mask = mask |...

python pandas null nan

230

Konwertuje liczbę zmiennoprzecinkową na ints w Pandach?

Pracowałem z danymi importowanymi z pliku CSV. Pandy zmieniły niektóre kolumny na zmiennoprzecinkowe, więc teraz liczby w tych kolumnach są wyświetlane jako zmiennoprzecinkowe! Jednak muszę je wyświetlać jako liczby całkowite lub bez przecinka. Czy istnieje sposób przekonwertować je na liczby...

python pandas floating-point integer dataset

229

Jak mogę uzyskać elementarne logiczne NOT serii pand?

Mam Seriesobiekt pandy zawierający wartości logiczne. Jak mogę uzyskać serię zawierającą logikę NOTkażdej wartości? Rozważmy na przykład serię zawierającą: True True True False Seria, którą chciałbym uzyskać, zawierałaby: False False False True Wydaje się, że powinno to być dość proste, ale...

python pandas boolean-logic

229

Pandy otrzymują wiersze, które NIE znajdują się w innych ramkach danych

Mam dwie ramki danych pand, które mają wspólne wiersze. Załóżmy, że ramka danych2 jest podzbiorem ramki danych1. Jak mogę uzyskać wiersze ramki danych 1, których nie ma w ramce danych 2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 =...

python pandas dataframe

226

Normalizuj kolumny ramki danych pand

Mam ramkę danych w pandach, w których każda kolumna ma inny zakres wartości. Na przykład: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Masz pomysł, jak mogę znormalizować kolumny tej ramki danych, w których każda wartość mieści się w przedziale od 0 do 1? Moje pożądane wyjście to: A B C 1 1...

python pandas dataframe normalize

221

Jak zrobić dobre powtarzalne przykłady pand

Odpowiedzi na to pytanie są dziełem społeczności . Edytuj istniejące odpowiedzi, aby poprawić ten post. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Sporo czasu spędziłem na oglądaniu obu r i pandytagi na SO, mam wrażenie, że pandaspytania zawierają mniej...

python pandas

221

Wydobywanie tylko miesiąca i roku osobno z kolumny Pandas Datetime

Mam Dataframe, df, z następującą kolumną: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Elementy kolumny to pandas.tslib.Timestamp. Chcę tylko podać...

python pandas

221

Zastosuj wiele funkcji do wielu kolumn grupowania

W docs pokazują, jak zastosować wiele funkcji w obiekcie GroupBy naraz przy użyciu dict z nazwami kolumn wyjście jako klucze: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588...

python group-by aggregate-functions pandas

220

upuszczasz nieskończone wartości z ramek danych w pandach?

jaki jest najszybszy / najprostszy sposób na usunięcie wartości nan i inf / inf z pandy DataFrame bez resetowania mode.use_inf_as_null? Chciałbym móc używać argumentów subseti howargumentów dropna, z wyjątkiem infwartości uważanych za brakujące, takich jak: df.dropna(subset=["col1", "col2"],...

python numpy scipy pandas

220

Pobierz indeks kolumny z nazwy kolumny w pandach python

W R, gdy musisz pobrać indeks kolumny na podstawie nazwy kolumny, którą możesz zrobić idx <- which(names(my_data)==my_colum_name) Czy istnieje sposób, aby zrobić to samo z ramkami danych

python pandas dataframe indexing

218

Pandy Zamień NaN na pusty / pusty ciąg

Mam ramkę danych Pandas, jak pokazano poniżej: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Chcę usunąć wartości NaN z pustym ciągiem, aby wyglądał tak: 1 2 3 0 a "" read 1 b l unread 2 c ""

python pandas dataframe nan