Pytania oznaczone «dataframe»

13
Powolne pandy DataFrame MultiIndex reindex

Mam pand DataFrame formularza: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06...

12
Generuj filtrowane binarne produkty kartezjańskie

Opis problemu Szukam wydajnego sposobu generowania pełnych binarnych produktów kartezjańskich (tabele ze wszystkimi kombinacjami prawdy i fałszu z pewną liczbą kolumn), filtrowane według określonych warunków wyłączności. Na przykład dla trzech kolumn / bitów n=3otrzymalibyśmy pełną...

11
Scal ramki danych na podstawie wielu kolumn i progów

Mam dwa data.framesz wielu wspólnych kolumnach (tu: date, city, ctry, oraz ( other_) number). Chciałbym teraz scalić je w powyższych kolumnach, ale toleruję pewien poziom różnicy: threshold.numbers <- 3 threshold.date <- 5 # in days Jeśli różnica między datewpisami wynosi >...

11
zidentyfikować i oznaczyć zduplikowane wiersze wr

Chciałbym zidentyfikować i oznaczyć zduplikowane wiersze na podstawie 2 kolumn. Chciałbym utworzyć unikalny identyfikator dla każdego duplikatu, więc wiem nie tylko, że wiersz jest duplikatem, ale z którym wierszem jest duplikatem. Mam ramkę danych, która wygląda jak poniżej z niektórymi...

9
scal dwie ramki danych i dodaj poziom kolumny z nazwami

Cześć. Przekopałem się przez metody konkatacji, łączenia i łączenia pand i nie mogę znaleźć tego, czego chcę. Załóżmy, że mam dwie ramki danych A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col...