Kogo śledzić na github, aby dowiedzieć się o najlepszych praktykach w analizie danych?

28

Pomocne jest przestudiowanie kodu analizy danych ekspertów. Ostatnio czytałem github i jest tam wiele osób udostępniających kod analizy danych. Obejmuje to kilka pakietów R (które są oczywiście dostępne bezpośrednio z CRAN), ale także kilka przykładów powtarzalnych badań, szczególnie przy użyciu R ( patrz lista R na github ).

  • Kim są dobrzy ludzie, którzy powinni śledzić na githubie, aby dowiedzieć się o najlepszych praktykach w analizie danych?
  • Opcjonalnie, jaki kod współdzielą i dlaczego jest to przydatne?
Jeromy Anglim
źródło

Odpowiedzi:

18

Hadley Wickham . Ma kilka eksploracyjnych projektów analizy danych na Githubie, na które można spojrzeć (np. „Data-baby-names”), a biorąc pod uwagę niesamowitość ggplot2 / plyr / reshape, mam domyślne (ale niewidome) zaufanie do jego najlepszych praktyki, szczególnie w odniesieniu do własnych paczek.

Dodatkowo masz wczesne informacje o innych projektach, nad którymi on pracuje!

raegtin
źródło
5
(+1) Pracuje też nad zestawem samouczków na temat rozwoju Advanced R , bardzo przydatne!
chl
@Jeromy W rzeczywistości wydaje się, że jest to jedynie sposób na przygotowanie jego przyszłego podręcznika (sprawdź poprzednie tweety HW).
chl
9

Ja również śledzić John Myles Biały „s GitHub repozytorium . Istnieje kilka projektów zorientowanych na dane, ale także interesujące rzeczy dla programistów R.

chl
źródło