czy jest jakieś narzędzie do porządkowania danych dla pytona / pandy podobne do narzędzia R tidyr?

18

Pracuję nad wyzwaniem Kaggle, w którym niektóre zmienne są reprezentowane przez wiersze zamiast kolumn (zakłócenia sieci Telstra). Obecnie szukam odpowiednika funkcji gromadzenia (), separacji () i rozprzestrzeniania (), które można znaleźć w narzędziu R tidyr.

cpumar
źródło

Odpowiedzi:

3

R gather()zasadniczo zmienia się z szerokiego na długi. Więc,

  1. sprawdź stronę pandy, jak korzystać pandas.wide_to_long(),
  2. sprawdź na tym blogu, czy jest dyskusja na temat uzyskania eleganckiej gatherfunkcji w Pythonie.
ximiki
źródło
0

Próbowałem naśladować składniowo pakiet tidyr w pythonie w pakiecie o nazwie tidypython. Uczyniłem go kompatybilnym z pakietem dplython, który obejmuje użycie operatora >> do łączenia łańcuchów.

Nie został w pełni przetestowany, ale powinien działać całkiem dobrze:

https://github.com/durrantmm/tidypython

Daj mi znać, czy to działa dla Ciebie.

Matt Durrant
źródło