Pytania oznaczone «pandas»

13
Powolne pandy DataFrame MultiIndex reindex

Mam pand DataFrame formularza: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06...

12
pandasUDF i pyarrow 0.15.0

Niedawno zacząłem otrzymywać błędy w wielu pysparkzadaniach uruchomionych w klastrach EMR. Errosy są java.lang.IllegalArgumentException at java.nio.ByteBuffer.allocate(ByteBuffer.java:334) at org.apache.arrow.vector.ipc.message.MessageSerializer.readMessage(MessageSerializer.java:543) at...

12
Generuj filtrowane binarne produkty kartezjańskie

Opis problemu Szukam wydajnego sposobu generowania pełnych binarnych produktów kartezjańskich (tabele ze wszystkimi kombinacjami prawdy i fałszu z pewną liczbą kolumn), filtrowane według określonych warunków wyłączności. Na przykład dla trzech kolumn / bitów n=3otrzymalibyśmy pełną...

11
Identyfikacja rodziców i wszystkich ich dzieci na drzewach

Mam ramkę danych pand jako taką: parent child parent_level child_level A B 0 1 B C 1 2 B D 1 2 X Y 0 2 X D 0 2 Y Z 2 3 To drzewo wygląda tak A X / / \ B / \ /\ / \ C D Y | Z Chcę stworzyć coś, co wygląda następująco: root children A [B,C,D] X [D,Y,Z] lub root child A B A C A D X D X...

11
utwórz macierz NxN z jednej pandy kolumnowej

Mam ramkę danych z każdym wierszem o wartości listy. id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] muszę obliczyć wynik dla jednego wiersza i dla wszystkich innych wierszy Na przykład: Step 1: Take value of id 0: ['a','b','c'], Step 2: find the intersection...