Niedawno oglądałem świetne wideo Computerphile na temat haseł, w którym Mike Pound chwali się superkomputerem swojej firmy z 4 kartami graficznymi (dokładnie Titan X).
Jako entuzjasta symulacji numerycznych marzę o zbudowaniu pulpitu wyłącznie do prac symulacyjnych. Dlaczego Mike Pound mierzy zdolności obliczeniowe swojego komputera za pomocą kart graficznych, a nie procesorów? Gdybym budował komputer, o co powinienem dbać bardziej?
Odpowiedzi:
Mike Pound najwyraźniej ceni zdolność obliczeniową kart graficznych wyższą niż zdolność obliczeniowa procesorów.
Dlaczego? Karta graficzna składa się zasadniczo z WIELU uproszczonych procesorów, które działają równolegle. W przypadku niektórych prac symulacyjnych wiele obliczeń można łatwo sparaliżować i przetwarzać równolegle na tysiącach rdzeni dostępnych na kartach graficznych, skracając całkowity czas przetwarzania.
o który przedmiot powinienem dbać bardziej? To naprawdę zależy od obciążenia, na którym ci zależy, oraz od tego, jak obciążenie to może / jest sparaliżowane do użycia na karcie graficznej. Jeśli obciążenie jest zawstydzająco równoległym zestawem prostych obliczeń, a oprogramowanie zostało napisane, aby korzystać z dostępnych kart graficznych, wówczas więcej kart graficznych będzie miało znacznie większy wpływ na wydajność niż więcej procesorów (dolar za dolara).
źródło
Sprawdź https://developer.nvidia.com/cuda-zone (i Google cuda nvidia, aby uzyskać więcej informacji). Architektura cuda i wysokiej klasy karty graficzne są dość szeroko stosowane w superkomputerach stacjonarnych. Zazwyczaj można złożyć kilka kart Tflop za mniej niż 10 000 USD (USD) przy użyciu gotowych komponentów Whitebox.
Więc...
... cuda to dla ciebie najlepsza gra w mieście. Może spróbuj ponownie zapytać na /scicomp// lub w innej witrynie stosu wymiany, bardziej bezpośrednio zaangażowanej w tego rodzaju sprawy.
(Nawiasem mówiąc, zakładam, że nie podoba ci się pomysł, że mówimy tutaj o masowo równoległym programowaniu, więc może być konieczne zapoznanie się z tym paradygmatem projektowania algorytmów.)
źródło
Z praktycznego punktu widzenia prawdopodobnie powinieneś zwrócić uwagę na płytę główną i procesor, biorąc pod uwagę względną trudność aktualizacji w porównaniu do GPU. Po zakupie jest okropny czas na odkrycie, że nie masz miejsca na cztery procesory graficzne lub wystarczająco szybki procesor, aby wszystkie były zajęte.
Należy również pamiętać, że wydajność procesora graficznego jest najczęściej zgłaszana w przypadku FLOP o pojedynczej precyzji, a spada nieco w przypadku podwójnej precyzji. Jeśli potrzebujesz dodatkowej precyzji w swoich symulacjach, skończysz znacznie poniżej reklamowanej prędkości.
Off do wyścigów inżynierii oprogramowania
Istnieją naprawdę dwie główne obawy z punktu widzenia oprogramowania, wąskie gardło von Neumanna i model programowania. Procesor ma dość dobry dostęp do pamięci głównej, GPU ma na pokładzie dużą ilość szybszej pamięci. Nie jest nieznane, że czas przenoszenia danych do i z GPU całkowicie neguje jakiekolwiek zwycięstwo prędkości. Ogólnie procesor wygrywa w przypadku umiarkowanych obliczeń na dużych ilościach danych, podczas gdy GPU przoduje w ciężkich obliczeniach na mniejszych ilościach. Wszystko to prowadzi nas do modelu programowania.
Na wysokim poziomie problemem jest starożytna i honorowa debata MIMD / SIMD. Systemy z wieloma instrukcjami / wieloma danymi odniosły największe sukcesy w informatyce ogólnej i komercyjnej. W tym modelu, który obejmuje SMP, istnieje wiele procesorów, z których każdy wykonuje swój własny strumień instrukcji. To komputerowy odpowiednik francuskiej kuchni, w której kierujesz niewielką liczbą wykwalifikowanych kucharzy do wykonania stosunkowo skomplikowanych zadań.
Z drugiej strony systemy z pojedynczą instrukcją / wieloma danymi bardziej przypominają ogromne pomieszczenie pełne urzędników przykutych do biur, zgodnie z instrukcjami z głównego sterownika. „Wszyscy DODAJ wiersze 3 i 5!” Był używany w czystej postaci w ILLIAC i niektórych systemach „mini-super”, ale zaginął na rynku. Obecne procesory graficzne są bliskimi kuzynami, są bardziej elastyczne, ale mają tę samą ogólną filozofię.
Podsumowując krótko:
źródło