Pytania oznaczone «pandas»

142

Jak załadować plik tsv do ramki danych Pandas?

Jestem nowy w Pythonie i Pandach. Próbuję tsvzaładować plik do pandy DataFrame. Oto, co próbuję, i otrzymuję błąd: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module>...

python pandas csv

142

Jak zdobyć pierwszą kolumnę pandy DataFrame jako serię?

Próbowałem: x=pandas.DataFrame(...) s = x.take([0], axis=1) I spobiera DataFrame, a nie

python dataframe pandas series

142

Pandy: przeglądanie listy arkuszy w pliku Excel

Nowa wersja Pandas używa następującego interfejsu do ładowania plików Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) ale co, jeśli nie znam dostępnych arkuszy? Na przykład pracuję z plikami programu Excel, które znajdują się poniżej Dane 1, Dane 2 ..., Dane...

python excel pandas openpyxl xlrd

142

Zmień nazwę indeksu Pandas DataFrame

Mam plik csv bez nagłówka z indeksem DateTime. Chcę zmienić nazwę indeksu i kolumny, ale za pomocą df.rename () zmienia się tylko nazwa kolumny. Pluskwa? Jestem na wersji 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0]...

python pandas dataframe

141

Zastępowanie wartości kolumn w pandach DataFrame

Próbuję zastąpić wartości w jednej kolumnie ramki danych. Kolumna („kobieta”) zawiera tylko wartości „kobieta” i „mężczyzna”. Próbowałem następujących rzeczy: w['female']['female']='1' w['female']['male']='0' Ale otrzymaj dokładnie tę samą kopię poprzednich wyników. Idealnie chciałbym uzyskać...

python pandas

139

Sprawdź, czy wartość istnieje w indeksie ramki danych pandy

Jestem pewien, że jest na to oczywisty sposób, ale nie mogę teraz wymyślić nic sprytnego. Zasadniczo zamiast zgłaszać wyjątek, chciałbym uzyskać Truelub Falsesprawdzić, czy istnieje wartość w dfindeksie pand . import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]},...

python pandas ipython

138

Pandy: Ustawienie nr. max rzędów

Mam problem z wyświetleniem następujących informacji DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Problem polega na tym, że nie drukuje domyślnie wszystkich wierszy w notatniku ipython, ale muszę ciąć, aby wyświetlić wynikowe wiersze. Nawet następująca...

python formatting pandas ipython-notebook

138

Pandy Pythona: wypełnij ramkę danych wiersz po wierszu

Wydaje się, że proste zadanie dodania wiersza do pandas.DataFrameobiektu jest trudne. Istnieją 3 pytania związane z przepełnieniem stosu, z których żadne nie daje roboczej odpowiedzi. Oto, co próbuję zrobić. Mam DataFrame, której kształt już znam, a także nazwy wierszy i kolumn. >>>...

python dataframe row pandas

138

Pandy read_csv z adresu url

Używam języka Python 3.4 z IPythonem i mam następujący kod. Nie mogę odczytać pliku CSV z podanego adresu URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) Mam następujący błąd „Oczekiwana...

python csv pandas request

135

Pandy dzielą kolumnę list na wiele kolumn

Mam pandy DataFrame z jedną kolumną: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Wynik: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF,...

python pandas

135

pandy: Jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv, a obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić za pomocą określonego separatora. Zastanawiałem się, czy można to zrobić w prosty sposób za pomocą pand lub Pythona? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04...

python pandas dataframe

135

jak sprawdzić typ kolumny w pandach Pythona

Potrzebuję różnych funkcji do traktowania kolumn numerycznych i kolumn z ciągami. To, co teraz robię, jest naprawdę głupie: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,

python pandas

135

pandy: wiele warunków podczas indeksowania ramki danych - nieoczekiwane zachowanie

Filtruję wiersze w ramce danych według wartości w dwóch kolumnach. Z jakiegoś powodu operator OR zachowuje się tak, jak powinienem oczekiwać operatora AND i odwrotnie. Mój kod testowy: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1...

python pandas boolean-logic

134

Jak wydrukować obiekt grupowania

Chcę wydrukować wynik grupowania z Pandami. Mam ramkę danych: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Podczas drukowania po pogrupowaniu według „A”...

python pandas

133

Normalizuj dane w pandach

Załóżmy, że mam ramkę danych pandy df: Chcę obliczyć średnią kolumnową ramki danych. To jest łatwe: df.apply(average) następnie zakres mądry kolumny max (col) - min (col). To znowu jest łatwe: df.apply(max) - df.apply(min) Teraz dla każdego elementu chcę odjąć średnią z jego kolumny i...

python pandas numpy

133

sprawdź, czy zmienna to dataframe

kiedy moja funkcja f jest wywoływana ze zmienną, chcę sprawdzić, czy var jest ramką danych pandy: def f(var): if var == pd.DataFrame(): print "do stuff" Myślę, że rozwiązanie może być dość proste, ale nawet z def f(var): if var.values != None: print "do stuff" Nie mogę zmusić go do...

python pandas

132

Pandy DataFrame: zamień wszystkie wartości w kolumnie na podstawie warunku

Mam prostą ramkę DataFrame, taką jak poniżej: Chcę wybrać wszystkie wartości z kolumny „Pierwszy sezon” i zastąpić te, które są powyżej 1990 r., 1. W tym przykładzie tylko Baltimore Ravens zastąpiłoby rok 1996 wartością 1 (pozostawiając resztę danych w stanie nienaruszonym). Użyłem...

python pandas dataframe

132

Jak mogę jeden kod na gorąco w Pythonie?

Mam problem z klasyfikacją systemów uczących się z 80% zmiennych kategorialnych. Czy muszę używać jednego kodowania na gorąco, jeśli chcę użyć jakiegoś klasyfikatora do klasyfikacji? Czy mogę przekazać dane do klasyfikatora bez kodowania? Próbuję wykonać następujące czynności w celu wyboru...

python pandas machine-learning anaconda one-hot-encoding

131

jaki jest najbardziej skuteczny sposób liczenia wystąpień w pandach?

Mam dużą (około 12 mln wierszy) df ramki danych z powiedzmy: df.columns = ['word','documents','frequency'] Tak więc następujące działania przebiegały w odpowiednim czasie: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord =

python pandas

129

Usuń niechciane części ze strun w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z ciągów w kolumnie DataFrame. Dane wyglądają następująco: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Muszę przyciąć te dane do: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00...

python string pandas dataframe