Jakie pakiety R są najbardziej przydatne w codziennej pracy?

28

Duplikat wątku: Właśnie zainstalowałem najnowszą wersję R. Jakie pakiety powinienem uzyskać?

Jakie są pakiety R , których nie wyobrażasz sobie w codziennej pracy z danymi? Proszę wymienić zarówno ogólne, jak i szczegółowe narzędzia.

AKTUALIZACJA: Jak na 24.10.10 ggplot2wydaje się być zwycięzcą z 7 głosami.

Inne wymienione pakiety więcej niż jeden to:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Dziękuję wszystkim za odpowiedzi!

radek
źródło
1
Bardzo subiektywne pytanie: na to pytanie nie można odpowiedzieć i nie jest odpowiednie dla witryny zapewniania jakości.
Egon Willighagen,
3
Powinny być prawdopodobnie wiki społeczności; przydatne pytanie tutaj, ale nie ma ostatecznej odpowiedzi.
Shane,
2
@Shane: dobra uwaga. przeniósł. @ Egon: rzeczywiście subiektywny. ale jeśli odpowiedzi pochodzą od kompetentnych ludzi, nie mam nic przeciwko dawce podmiotowości. zacząłem uczyć się R całkiem niedawno i mam kilkadziesiąt zainstalowanych do eksploracji, jednak zauważam, że istnieją narzędzia, których używam znacznie częściej, niezależnie od wykonywanego zadania.
radek
Byłoby interesujące, gdyby StackExchange obsługiwał jakąś metodę łączenia postów wiki społeczności między witrynami. Ponieważ założę się, że to pytanie zostało zadane na Stackoverflow i myślę również, że Analiza Statystyczna może przyciągnąć osoby, które zwykle nie odwiedzają SO.
Sharpie
@Sharpie: było kilka interesujących postów SO, takich jak stackoverflow.com/questions/1295955/… lub stackoverflow.com/questions/1535021/... jednak nie koncentrują się one na pakietach. i zgadzam się, połączenie wiki społeczności może być bardzo przydatne.
radek

Odpowiedzi:

23

Codziennie używam plyr i ggplot2 .

W dużej mierze polegam również na pakietach szeregów czasowych; szczególnie pakiet zoo .

Shane
źródło
8

Używam xtable pakietu. Pakiet xtable przekształca tabele utworzone przez R (w szczególności tabele zawierające wyniki anova) w tabele LaTeX, które zostaną uwzględnione w artykule.

Mehper C. Palavuzlar
źródło
8

multicore jest całkiem fajnym narzędziem do przyspieszania skryptów.
cacheSweave oszczędza dużo czasu podczas używania Sweave.

użytkownik88
źródło
8

ggplot2 - najlepsza wizualizacja dla R.

RMySQL / RSQLite / RODBC - do łączenia się z bazami danych

sqldf - manipuluj data.frames za pomocą zapytań SQL

Hmisc / rms - pakiety Franka Harrella, zawierające wygodne funkcje dodatkowe i ładne funkcje do analiz regresji.

GenABEL - fajny pakiet do badań asocjacyjnych całego genomu

Rcmdr - przyzwoity GUI dla R, jeśli go potrzebujesz.

Zobacz także CRANtastic - ten link zawiera listę najpopularniejszych pakietów R. Wiele osób na początku listy zostało już wspomnianych

Stephen Turner
źródło
8

data.table jest teraz moim ulubionym! Z niecierpliwością czekamy na nową wersję z większą liczbą życzeń.

Branson
źródło
6

Dla mnie osobiście najczęściej korzystam z trzech następujących pakietów, wszystkie dostępne w niesamowitym projekcie Omega do obliczeń statystycznych (nie twierdzę, że jestem ekspertem, ale dla moich celów są bardzo łatwe w użyciu):

  • RCurl : Ma wiele opcji, które pozwalają na dostęp do stron internetowych, z którymi domyślne funkcje w bazie R miałyby problemy, myślę, że to uczciwe. Jest to interfejs R do biblioteki libcurl, który ma dodatkową zaletę dla całej społeczności poza rozwijaniem go przez R. Dostępne również w CRAN .

  • XML : Bardzo wybacza analizowanie zniekształconego XML / HTML. Jest to interfejs R do biblioteki libxml2 i znów ma tę dodatkową zaletę, że cała społeczność poza R rozwija ją. Dostępny również w CRAN .

  • RJSONIO : Pozwala przeanalizować tekst zwrócony z wywołania json i uporządkować go w strukturę listy w celu dalszej analizy. Konkurentem tego pakietu jest rjson, ale ten ma tę zaletę, że jest wektoryzowany, łatwo rozszerzalny przez S3 / S4, szybko i skalowalne do dużych danych.
Tony Breyal
źródło
6

Sweave pozwala osadzić kod R w dokumencie LaTeX. Wyniki wykonania kodu i opcjonalnie kodu źródłowego stają się częścią końcowego dokumentu.

Zamiast na przykład wklejać obraz wytworzony przez R do pliku LaTeX, możesz wkleić kod R do pliku i zachować wszystko w jednym miejscu.

John D. Cook
źródło
4
Tylko wskazówka dla wszystkich, którzy chcą rozpocząć powtarzalne badania z R. knitrRadziłbym, abyś spojrzał na nowy pakiet zamiast Sweave. Jest to po prostu Sweave na sterydach. Uczenie się jest równie łatwe, jeśli nie łatwiejsze, i znacznie bardziej elastyczne.
Christoph_J
4

zoo i xts są koniecznością w mojej pracy!

Dr G.
źródło
4

Uważam krata wraz z towarzyszącym książce „Krata: wielowymiarowe Wizualizacji danych z R” przez Deepayan Sarkar bezcenne.

NPE
źródło
4

Jeśli wykonujesz jakiekolwiek modelowanie predykcyjne, Caret jest darem niebios. Szczególnie w połączeniu z pakietem wielordzeniowym możliwe są niesamowite rzeczy.

Zach
źródło
4

Codziennie najbardziej użytecznym pakietem musi być „obcy”, który ma funkcje do odczytu i zapisu danych dla innych pakietów statystycznych, np. Stata, SPSS, Minitab, SAS itp. Praca w dziedzinie, w której R nie jest tak powszechne, oznacza, że ​​to to bardzo ważny pakiet.

Graham Cookson
źródło
3

używam

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, reshape, RODBC, TeachingDemos, XML.

dużo.

esco
źródło
3

Nie mógłbym żyć bez:

  • sieć grafiki
  • xlsx lub XLConnect do odczytu plików Excel
  • rtf do tworzenia raportów w formacie rtf (wolałbym Sword lub R2wd, ale nie mogę zainstalować statconn w pracy; na pewno wkrótce wypróbuję odfWeave ).
  • nlme i lme4 dla modeli mieszanych
  • ff do pracy z dużymi tablicami
Stéphane Laurent
źródło
2

RODBC do uzyskiwania dostępu do danych z baz danych, sqldf do wykonywania prostych zapytań SQL na ramkach danych (chociaż zmuszam się do używania natywnych poleceń R) oraz ggplot2 i plyr

wahalulu
źródło
2

Używamy głównie:

  • ggplot - dla wykresów
  • statystyki
  • e1071 - dla SVM
mohanów
źródło
Możesz także sprawdzić kernlab i zająć się SVM. Są interesującymi (niekoniecznie lepszymi) alternatywami.
Zach
2

krata, samochód, MASA, obcy, impreza.

Peter Flom - Przywróć Monikę
źródło
2

Dla mnie używam kernlab do Lab Learning Machine Lab opartego na jądrze i e1071 dla SVM i ggplot2 dla grafiki

404Dreamer_ML
źródło
2

Często używam ggplot2, wegańskiego i przekształcam.

EDi
źródło
2

Lubię roxygen za jego funkcję Curry ().

charles.y.zheng
źródło
2

RColorBrewer nie został tutaj wymieniony, często używam go do drukowania, jeśli potrzebuję schematów kolorów

Arne Jonas Warnke
źródło
2

Jestem wielkim fanem RCPP, gdy potrzebuję szybkiej pętli for lub wykonywania zabiegów niezbyt zgodnych z R. Jest bardzo dobrze zaimplementowany w systemie Eco eco, może odbierać Matrycę / rzadką Matrycę bez konwersji jako argumenty w funkcji.

Składnia w C ++ jest łatwa, gdy robisz proste rzeczy (co często jest moim przypadkiem).

Naprawdę, nie musisz być twórcą pakietów, aby potrzebować tej niesamowitej biblioteki.

Czy powiedziałem, że C ++ jest bardzo szybki?

pommedeterresautee
źródło
2

DoParallel i foreach pakiety dokonały moje życie o wiele łatwiej, pozwalając mi parallelize mój kod i uruchomić go na obliczeniowej zoptymalizowane przykład na Amazon EC2 ! Używam ich bardzo często. Nie byłoby to jednak możliwe bez RStudio AMI wydanych przez Louisa Asletta. Na koniec muszę wspomnieć o pakiecie stringr , który naprawdę sprawia, że ​​praca z ciągami staje się spacerkiem w parku. Użyj go w każdej aplikacji do eksploracji tekstu. I często używam knitr do tworzenia wysokiej jakości raportów z mojej pracy. Wielkie dzięki za ten niesamowity pakiet Yihui Xie!

Antoine
źródło
1

Coraz częściej używam ggplot2, przekształcam kształty, kraty, knitr.

Jdbaba
źródło