Pracuję nad wyzwaniem Kaggle, w którym niektóre zmienne są reprezentowane przez wiersze zamiast kolumn (zakłócenia sieci Telstra). Obecnie szukam odpowiednika funkcji gromadzenia (), separacji () i rozprzestrzeniania (), które można znaleźć w narzędziu R tidyr.
18
Odpowiedzi:
Zacznę od funkcji melt () w pandach. Napisałem o tym artykuł:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=en
źródło
R
gather()
zasadniczo zmienia się z szerokiego na długi. Więc,pandas.wide_to_long()
,gather
funkcji w Pythonie.źródło
Próbowałem naśladować składniowo pakiet tidyr w pythonie w pakiecie o nazwie tidypython. Uczyniłem go kompatybilnym z pakietem dplython, który obejmuje użycie operatora >> do łączenia łańcuchów.
Nie został w pełni przetestowany, ale powinien działać całkiem dobrze:
https://github.com/durrantmm/tidypython
Daj mi znać, czy to działa dla Ciebie.
źródło