Pytania oznaczone «pandas»

142
Jak załadować plik tsv do ramki danych Pandas?

Jestem nowy w Pythonie i Pandach. Próbuję tsvzaładować plik do pandy DataFrame. Oto, co próbuję, i otrzymuję błąd: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module>...

142
Pandy: przeglądanie listy arkuszy w pliku Excel

Nowa wersja Pandas używa następującego interfejsu do ładowania plików Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) ale co, jeśli nie znam dostępnych arkuszy? Na przykład pracuję z plikami programu Excel, które znajdują się poniżej Dane 1, Dane 2 ..., Dane...

142
Zmień nazwę indeksu Pandas DataFrame

Mam plik csv bez nagłówka z indeksem DateTime. Chcę zmienić nazwę indeksu i kolumny, ale za pomocą df.rename () zmienia się tylko nazwa kolumny. Pluskwa? Jestem na wersji 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0]...

141
Zastępowanie wartości kolumn w pandach DataFrame

Próbuję zastąpić wartości w jednej kolumnie ramki danych. Kolumna („kobieta”) zawiera tylko wartości „kobieta” i „mężczyzna”. Próbowałem następujących rzeczy: w['female']['female']='1' w['female']['male']='0' Ale otrzymaj dokładnie tę samą kopię poprzednich wyników. Idealnie chciałbym uzyskać...

138
Pandy: Ustawienie nr. max rzędów

Mam problem z wyświetleniem następujących informacji DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Problem polega na tym, że nie drukuje domyślnie wszystkich wierszy w notatniku ipython, ale muszę ciąć, aby wyświetlić wynikowe wiersze. Nawet następująca...

138
Pandy read_csv z adresu url

Używam języka Python 3.4 z IPythonem i mam następujący kod. Nie mogę odczytać pliku CSV z podanego adresu URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) Mam następujący błąd „Oczekiwana...

135
Pandy dzielą kolumnę list na wiele kolumn

Mam pandy DataFrame z jedną kolumną: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Wynik: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF,...

135
pandy: Jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv, a obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić za pomocą określonego separatora. Zastanawiałem się, czy można to zrobić w prosty sposób za pomocą pand lub Pythona? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04...

135
jak sprawdzić typ kolumny w pandach Pythona

Potrzebuję różnych funkcji do traktowania kolumn numerycznych i kolumn z ciągami. To, co teraz robię, jest naprawdę głupie: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,

134
Jak wydrukować obiekt grupowania

Chcę wydrukować wynik grupowania z Pandami. Mam ramkę danych: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Podczas drukowania po pogrupowaniu według „A”...

133
Normalizuj dane w pandach

Załóżmy, że mam ramkę danych pandy df: Chcę obliczyć średnią kolumnową ramki danych. To jest łatwe: df.apply(average) następnie zakres mądry kolumny max (col) - min (col). To znowu jest łatwe: df.apply(max) - df.apply(min) Teraz dla każdego elementu chcę odjąć średnią z jego kolumny i...

133
sprawdź, czy zmienna to dataframe

kiedy moja funkcja f jest wywoływana ze zmienną, chcę sprawdzić, czy var jest ramką danych pandy: def f(var): if var == pd.DataFrame(): print "do stuff" Myślę, że rozwiązanie może być dość proste, ale nawet z def f(var): if var.values != None: print "do stuff" Nie mogę zmusić go do...

129
Usuń niechciane części ze strun w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z ciągów w kolumnie DataFrame. Dane wyglądają następująco: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Muszę przyciąć te dane do: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00...