Pytania oznaczone «dataframe»

144
pandy unikalne wartości wielu kolumn

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Jaki jest najlepszy sposób na zwrócenie unikatowych wartości „Col1” i „Col2”? Żądane wyjście to 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'...

142
Określ liczbę wartości NA w kolumnie

Chcę policzyć liczbę NAwartości w kolumnie ramki danych. Powiedzmy, że nazywa się moja ramka danych df, a nazwa kolumny, którą rozważam, to col. Sposób, który wymyśliłem, jest następujący: sapply(df$col, function(x) sum(length(which(is.na(x))))) Czy to dobry / najbardziej efektywny sposób, aby...

142
Zmień nazwę indeksu Pandas DataFrame

Mam plik csv bez nagłówka z indeksem DateTime. Chcę zmienić nazwę indeksu i kolumny, ale za pomocą df.rename () zmienia się tylko nazwa kolumny. Pluskwa? Jestem na wersji 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0]...

138
Pomiń wiersze zawierające określoną kolumnę NA

Chcę wiedzieć, jak pomijać NAwartości w ramce danych, ale tylko w niektórych kolumnach, które mnie interesują. Na przykład, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) ale chcę tylko pominąć dane, w których yjest NA, dlatego wynik powinien być x y z 1 1 0 NA 2 2...

137
Jak zapisać ramkę data.frame w R?

Zrobiłem ramkę data.frame w R, która nie jest zbyt duża, ale jej zbudowanie zajmuje trochę czasu. Chciałbym zapisać go jako plik, który mogę potem ponownie otworzyć w

135
pandy: Jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv, a obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić za pomocą określonego separatora. Zastanawiałem się, czy można to zrobić w prosty sposób za pomocą pand lub Pythona? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04...

129
R - Połączyć dwie ramki danych?

Biorąc pod uwagę dwie ramki danych ai b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3...

129
Usuń niechciane części ze strun w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z ciągów w kolumnie DataFrame. Dane wyglądają następująco: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Muszę przyciąć te dane do: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00...