Platformy przetwarzania w chmurze do uczenia maszynowego [zamknięte]

Odpowiedzi:

15

Nie korzystałem z tych firm, ale to tylko niektóre z opcji. Jednak konfiguracja EC2 jest bardzo prosta. Przynajmniej po tym, jak zdrętwiałeś głowę, uderzając nią o ścianę wystarczająco mocno i wystarczająco często. Zwiększa także próg bólu. Dzieci mają teraz o wiele łatwiej. Kiedy zaczynałem, zajmowaliśmy się obliczeniami przeciwmgielnymi: nie mieliśmy najbardziej mglistego, co obliczaliśmy.

Pomijając wspomnienia ... Istnieją narzędzia i zasoby, aby ominąć tych dostawców i zacząć samodzielnie. Dzięki JD Longsegue łatwiej było zacząć używać R na EMR.

Jeśli chodzi o Python, boto jest pakietem, który pozwala na łatwe uruchomienie i uruchomienie Pythona na EC2. Bardzo łatwo jest uruchomić Python w AppEngine Google , jeśli chcesz rozważyć alternatywę EC2. Jeśli znasz Pythona, to tak naprawdę nie ma potrzeby zatrudniania firmy, która wykona za ciebie zadanie, chyba że nie znasz się na skalowaniu, dzieleniu, równoważeniu obciążenia itp., Nawet na poziomie koncepcyjnym. Z drugiej strony, jeśli zastanawiasz się nad wydaniem dużych pieniędzy na takie usługi, dobrym pomysłem jest zaznajomienie się ze sposobem na zwiększenie wydajności kodu.

Jeśli chodzi o Octave w chmurze, nie mam pojęcia, co istnieje poza tymi trzema firmami. Monkey Analytics kiedyś to oferowało, ale wygląda na to, że ich nie ma. Poleciłbym unikać Octave i skupić się na Python lub R.

Jednym z zasobów ułatwiających konfigurację jest StarCluster . Ponownie, nie ma z nimi doświadczenia, ale może to być pomocna trasa.

Szczerze mówiąc, Ubuntu (lub Windows) i EC2 nie są trudne do nauczenia się. Naprawdę nie polecałbym Windows dla R, ponieważ nie ma zbyt wiele miłości między programistami R i Windows. (NB: O ile wiem, nie ma poważnych usług w chmurze dla systemu Mac OS X.) Kiedy już masz zdalny pulpit, jesteś w biznesie. Nauka skalowania to kolejny krok.


Aktualizacja 1: Inne, bardziej ogólne usługi zarządzania chmurą obejmują RighstScale i Scalr.

Aktualizacja 2: Chcę podkreślić, że nauka samodzielnego konfigurowania instancji i klastrów w chmurze jest ważna. Wśród korzyści z praktycznej pracy:

  • Dowiedz się, jak zarządzać mieszanką zasobów (wiele instancji, wiele typów instancji, wiele dysków HD, różne strefy lub regiony dostępności, różne narzędzia monitorowania i inne)
  • Tinker z GPU, jeśli chcesz (sprawdź gputools)
  • Możesz łatwiej zaktualizować lub przywrócić wybrane pakiety
  • Możesz być w stanie uzyskać znacznie niższe koszty, używając instancji spotowych lub instancji zarezerwowanych.
  • Możesz wypróbować różne R GUI lub IDE, które mogą nie być opcją dla dostawców chmury.

Korzystanie z zarządzanego dostawcy ma zalety, takie jak krótsza krzywa uczenia się, być może lepsze wsparcie dla dzielenia się zasobami między grupą i może jakieś fajne gadżety, ale nie mogę mówić o korzyściach, ponieważ zacząłem używać EC2 przed którąkolwiek z nich wszedł na rynek.

Iterator
źródło
5

Istnieje również PiCloud do równoległego uruchamiania kodu Python na EC2.

Na stronie produktu :

PiCloud to platforma chmurowa, która integruje się z językiem programowania Python. Umożliwia wykorzystanie mocy obliczeniowej Amazon Web Services bez konieczności zarządzania, utrzymywania lub konfigurowania serwerów wirtualnych.

PiCloud bezproblemowo integruje się z istniejącą bazą kodu za pomocą niestandardowej biblioteki Python, chmury. Aby odciążyć wykonanie funkcji na naszych serwerach, wystarczy przekazać żądaną funkcję do biblioteki w chmurze. PiCloud uruchomi tę funkcję w swoim klastrze o wysokiej wydajności. Gdy uruchomisz więcej funkcji, nasz klaster automatycznie skaluje się, aby spełnić Twoje potrzeby obliczeniowe. Wejście do chmury nigdy nie było tak łatwe!

Cloudartisan
źródło
Uwielbiam PiCloud - uważam, że niezwykle łatwo je uruchomić.
Fomite,
3

Czy próbowałeś już CloudStat ? W odróżnieniu od innych chmur, CloudStat jest przeznaczony tylko dla użytkowników języka R. Nie ma już konfiguracji. możesz po prostu zalogować się i użyć do 7,5 GB pamięci RAM za darmo.

Jednak w przypadku bezpłatnego konta Twoja analiza będzie wyświetlana i wykorzystywana publicznie. Opcją jest zapłacić 5 USD miesięcznie, aby Twoja analiza była prywatna.

Kai Feng Chew
źródło
0

Jedną z platform chmurowych, którą mogę polecić, jest Backbone, który zapewnia bezpieczną platformę chmurową zwiększającą produktywność .

użytkownik46245
źródło
Czy mają ofertę dla R? Nie szukam ogólnego dostawcy usług w chmurze, szukam takiego, który zapewnia wstępnie skonfigurowane serwery R (najlepiej RStudio).
Zach