Interfejsy API / kanały danych dostępne jako pakiety w języku R

53

EDYCJA: Widok zadań CRAN technologii internetowych i usług zawiera znacznie bardziej wyczerpującą listę źródeł danych i interfejsów API dostępnych w R. Możesz wysłać żądanie ściągnięcia na github, jeśli chcesz dodać pakiet do widoku zadania.


Tworzę listę różnych plików danych, które są już podłączone do R lub są łatwe do skonfigurowania. Oto moja początkowa lista pakietów i zastanawiałem się, czego jeszcze mi brakuje.

Próbuję ograniczyć tę listę do plików danych / interfejsów API „w czasie rzeczywistym” lub „w czasie rzeczywistym”, w których dane podstawowe mogą się zmieniać między pobraniami. Istnieje wiele list statycznych zestawów danych, które wymagają tylko jednego pobrania.

Ta lista jest obecnie stronnicza w stosunku do danych finansowych / szeregów czasowych i przydałaby mi się pomoc w rozszerzeniu jej na inne domeny.

Dane za darmo:
Źródło danych - pakiet
Google Finance danych historycznych - quantmod
Google Finance bilanse - quantmod
Yahoo Finance danych historycznych - quantmod
Yahoo Finance dane historyczne - tseries
Yahoo Finance bieżące opcje łańcuchowe - quantmod
Yahoo Finansów szacuje historyczny analityków - fImport
Yahoo Finance aktualnych kluczowych statystyk - fImport - wydaje się być zepsuty
Historyczne kursy wymiany OANDA / ceny metali -
Historyczne wskaźniki makroekonomiczne Quantmod FRED - Historyczne wskaźniki makroekonomiczne
Banku Światowego Quantmod - WDI
Google Trends historyczny wyszukiwania danych objętość - RGoogleTrends
Google Docs - RGoogleDocs
Google bagażu - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
US Census 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - wymaga darmowe konto
Factual.com - factualR
adresy Geokodując - RDSTK Mapuj
współrzędne do granic politycznych - RDSTK
Weather Underground - Rzuć własną
Google News - Rzuć własne dane NetCDF dla
nauk o ziemi - Rzuć własne dane dotyczące klimatu - Rzuć własne dane dotyczące zdrowia publicznego - Rzuć własne OAI Harvester - Zbieracz Inicjatywy Open Archives RAmazonS3 - Serwer pamięci masowej S3 Amazon Rflikr - Flikr API




Wymaga subskrypcji:
Bloomberg - RBloomberg
LIM - LIM
Transakcje i notowania z NYSE - RTAQ
Interactive Brokers - IBrokers

Zach
źródło
1
zależy od tego, co rozumiesz przez „łatwy do skonfigurowania” ... Mam wiele niestandardowych skryptów, które są „łatwe do skonfigurowania”
David LeBauer
2
Obecnie definiuję „łatwy do skonfigurowania” jako „pakiet istnieje” lub „ktoś opublikował / opublikował funkcję pobierania danych”
Zach.
Dalej zdefiniowałbym „pakiety istnieją” jako „pakiet jest w CRAN” lub „pakiet jest w R Forge”, „pakiet znajduje się w publicznym repozytorium podobnym do CRAN”.
Zach.
Dodanie: rejestr federalny API (w przygotowaniu).
ks.
Ten wątek może być także interesujące: import cen akcji od Yahoo Finance do badań .
gung - Przywróć Monikę

Odpowiedzi:

8
  1. Instrukcje dotyczące używania R do pobierania danych netCDF można znaleźć tutaj , wspólny format używany do przechowywania danych naukowych o Ziemi, np. Jak w morskich danych geoprzestrzennych z OpenEarth lub sterownika modelu klimatu i prognoz z UCAR

  2. rnpn (w fazie rozwoju) umożliwia uzyskanie danych z National Phenology Network - obywatelskiego projektu naukowego mającego na celu śledzenie czasu zielonkowania roślin, kwitnienia i starzenia się. Zobacz post na blogu programisty .

  3. -obsolete- RClimate zapewnia narzędzia do pobierania danych klimatycznych o płaskich plikach i manipulowania nimi (wraz z samouczkami, w tym tutaj -

  4. Pobierz historyczne dane finansowe za pomocą tseries::get.hist.quote

  5. Dokumenty Michaela Samuela pobierające dane dotyczące zdrowia publicznego

  6. raster::getData zapewnia dostęp do zmiennych klimatycznych przez worldclim

Davida
źródło
Co to są „dane netCDF?”
Zach
@Zach NetCDF to rodzaj uniwersalnego, uporządkowanego sposobu przechowywania dużych zbiorów danych. Alternatywne podejście opiera się na formacie HDF5 .
chl
@David (+1) Bardzo dziękuję za czwarty punkt!
chl
Co się stało z RClimate? Nigdzie nie mogę znaleźć paczki
Daniel Ryback,
teraz na R jest biblioteka ncdf4 do obsługi netcdf4. Instalacja jest bardziej skomplikowana niż ncdf, ale myślę, że późniejsza wersja jest przestarzała. Kilka lat temu udało mi się nawet zainstalować netcdf4 z Min GW64, aby ten pakiet działał w systemie Windows :) jeśli to zrobię, oznacza to, że jest to wykonalne ... i wydaje się, że D. Pierce (autor pakietu) zapewnia źródła na jego stronie internetowej cirrus.ucsd.edu/~pierce/ncdf
robin girard
8

Istnieje projekt mający na celu utworzenie pakietów R w tym celu (interfejs R do interfejsów API w czasie rzeczywistym) o nazwie rOpenSci , który ma obecnie 18 pakietów lub jest w fazie rozwoju. Niektóre (rnpn, rfishbase) są już na twojej liście.

Świetna lista! i pełne ujawnienie - jestem częścią projektu rOpenSci.

cboettig
źródło
1
  1. ONETr - wydajna interakcja z O * NET ™ API, oferująca dane deskryptorów zawodowych z Departamentu Pracy USA.
RunChiRun
źródło