Pytania oznaczone «pandas»

129
Usuń niechciane części ze strun w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z ciągów w kolumnie DataFrame. Dane wyglądają następująco: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Muszę przyciąć te dane do: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00...

129
Połącz razem listę ramek danych pand

Mam listę ramek danych Pandas, które chciałbym połączyć w jedną ramkę danych Pandas. Używam Pythona 2.7.10 i Pandas 0.16.2 Utworzyłem listę ramek danych z: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000):...

129
Dodaj brakujące daty do pandy dataframe

Moje dane mogą mieć wiele wydarzeń w określonym dniu lub ŻADNYCH wydarzeń w danym dniu. Biorę te wydarzenia, liczę według daty i wykreślam je. Jednak kiedy je wykreślam, moje dwie serie nie zawsze pasują. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s =...

128
Usuwanie kolumny indeksu w pandach podczas czytania pliku CSV

Mam następujący kod, który importuje plik CSV. Istnieją 3 kolumny i chcę ustawić dwie pierwsze z nich na zmienne. Kiedy ustawię drugą kolumnę na zmienną „wydajność”, kolumna indeksu również zostanie dołączona. Jak pozbyć się kolumny indeksu? df = pd.DataFrame.from_csv('Efficiency_Data.csv',...

127
datetime dtypes w pandach read_csv

Czytam w pliku csv z wieloma kolumnami z datą i godziną. Musiałbym ustawić typy danych po wczytaniu pliku, ale czasy dat wydają się być problemem. Na przykład: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None,...

126
Jak zachować indeks podczas łączenia pand

Chciałbym połączyć dwa DataFramesi zachować indeks z pierwszej klatki jako indeks scalonego zbioru danych. Jednak gdy wykonuję scalanie, wynikowa ramka DataFrame ma indeks całkowity. Jak mogę określić, że chcę zachować indeks z lewej ramki danych? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2,...

126
pandy Pythona usuwają zduplikowane kolumny

Jaki jest najłatwiejszy sposób usunięcia zduplikowanych kolumn z ramki danych? Czytam plik tekstowy, który ma zduplikowane kolumny za pośrednictwem: import pandas as pd df=pd.read_table(fname) Nazwy kolumn to: Time, Time Relative, N2, Time, Time Relative, H2, etc... Wszystkie kolumny Time i...

123
Warunkowe zamień pandy

Mam DataFrame i chcę zamienić wartości w określonej kolumnie, które przekraczają wartość zerem. Myślałem, że jest to sposób na osiągnięcie tego: df[df.my_channel > 20000].my_channel = 0 Jeśli skopiuję kanał do nowej ramki danych, to proste: df2 = df.my_channel df2[df2 > 20000] = 0 Robi...

122
Pandy groupby: Jak uzyskać związek strun

Mam taką ramkę danych: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Powołanie In [10]: print df.groupby("A")["B"].sum() wróci A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Teraz chciałbym zrobić „to samo” dla kolumny „C”....