Pytania oznaczone «dataframe»

153
Pandy: suma wierszy DataFrame dla danych kolumn

Mam następującą ramkę DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Chciałbym dodać kolumnę 'e', która jest sumą kolumny 'a', 'b'i 'd'. Przeglądając fora,...

151
Czy pandy mogą automatycznie rozpoznawać daty?

Dziś pozytywnie zaskoczył mnie fakt, że pandy odczytując dane z pliku danych (np.) Potrafią rozpoznać typy wartości: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Przykładowo można to sprawdzić w ten sposób: for i, r in df.iterrows(): print type(r['col1']),...

150
Dataframe Pandy pobiera pierwszy wiersz każdej grupy

Mam pandy, które DataFramelubią podążać. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Chcę to pogrupować według...

150
Zastępowanie pustych wartości (spacji) NaN w pandach

Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04...

147
Konwertuj nazwy wierszy na pierwszą kolumnę

Mam taką ramkę danych: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at...