Kto z was na tym forum używa „> R z pakietem wielordzeniowym , pakietami śniegowymi lub CUDA , więc do zaawansowanych obliczeń, które wymagają więcej mocy niż procesor stacji roboczej? Na jakim sprzęcie obliczasz te skrypty? W domu / pracy czy masz dostęp do centrum danych?
Tło tych pytań jest następujące: Obecnie piszę mój tytuł magistra. praca na temat R i High Performance Computing i potrzebuję silnej wiedzy na temat tego, kto faktycznie używa R. Czytałem, że R miał 1 milion użytkowników w 2008 roku, ale to mniej więcej jedyne statystyki użytkowników, jakie mogłem znaleźć na ten temat - więc mam nadzieję, że odpowiedzi!
Z poważaniem Heinrich
Odpowiedzi:
Jestem biologiem, który modeluje wpływ zmian klimatu na okres międzyroczny na dynamikę populacji kilku gatunków wędrownych. Moje zestawy danych są bardzo duże (dane przestrzennie intensywne), więc uruchamiam kod R
multicore
na serwerach Amazon EC2. Jeśli moje zadanie wymaga szczególnie dużej ilości zasobów, wybiorę bardzo dużą czteroosobową bardzo dużą instancję wysokiej pamięci, która zawiera 26 jednostek procesora, 8 rdzeni i 68G pamięci RAM. W takim przypadku zwykle uruchamiam 4-6 skryptów jednocześnie, z których każdy działa na dość dużym zestawie danych. Do mniejszych zadań wybieram serwery z 4-6 rdzeniami i około 20 gigabajtami pamięci RAM.Uruchamiam te instancje (zwykle instancyjne, ponieważ są tańsze, ale mogą zostać zakończone w dowolnym momencie, gdy bieżąca stawka przekracza kwotę, którą wybrałem do zapłaty), uruchamiam skrypt na kilka godzin, a następnie kończę instancję po zakończeniu skryptu. Jeśli chodzi o obraz maszyny (Amazon Machine Image), wziąłem kogoś innego do instalacji Ubuntu, zaktualizowałem R, zainstalowałem moje pakiety i zapisałem jako prywatny AMI na mojej przestrzeni dyskowej S3.
Moja osobista maszyna to MacBook Pro z podwójnym rdzeniem i trudno jest jej rozwiązywać połączenia wielordzeniowe. W razie innych pytań zachęcamy do wysłania wiadomości e-mail.
źródło
Ponieważ pytasz, używam pakietu foreach z wielordzeniowym backendem. Używam go do dzielenia żenująco równoległego obciążenia na wiele rdzeni na jednym urządzeniu Nehalem z dużą ilością pamięci RAM. Działa to całkiem dobrze do danego zadania.
źródło
Pracuję w akademii i używam wielordzeniowych do niektórych ciężkich testów algorytmów uczenia maszynowego, głównie w oparciu o naszą konstelację Sun opartą na Opteron i kilka mniejszych klastrów; są to również kłopotliwie równoległe problemy, więc główną rolą wielordzeniowego jest rozkładanie obliczeń na węzeł bez zwielokrotnienia zużycia pamięci.
źródło
Śniegu i śniegu używam do równoległości kursu w klastrach HPC, a CUDA do precyzyjnego równoległego przetwarzania danych. Jestem w epidemiologii, zajmując się modelowaniem przenoszenia chorób. Więc używam obu.
źródło