Pytania oznaczone «gpu»

25
Jaki jest koszt zmiany stanu?

Programiści powinni mieć dość dobry pomysł na koszt niektórych operacji: na przykład koszt instrukcji procesora, koszt braku pamięci podręcznej L1, L2 lub L3, koszt LHS. Jeśli chodzi o grafikę, zdaję sobie sprawę, że nie mam pojęcia, czym one są. Mam na uwadze, że jeśli zamawiamy je według...

19
Dlaczego rekurencja jest zabroniona w OpenCL?

Chciałbym użyć OpenCL do przyspieszenia renderowania obrazów ze śledzeniem promieni, ale zauważam, że strona Wikipedii twierdzi, że rekurencja jest zabroniona w Open CL. Czy to prawda? Ponieważ w dużym stopniu wykorzystuję rekurencję podczas raytracingu, będzie to wymagało znacznej...

14
Dlaczego procesory graficzne nadal mają rasteryzatory?

Pomimo postępów współczesne procesory graficzne wciąż mają stałe rasteryzatory. Wysoce konfigurowalny, z programowalnymi modułami cieniującymi, ale mimo to nie w pełni programowalny. Dlaczego? Dlaczego procesory graficzne nie mogą być po prostu masowo równoległymi urządzeniami z uniwersalnymi...

13
Dlaczego w programowaniu GPU pożądana jest wydajność pracy?

Czytałem następujący artykuł na temat wykonywania równoległego skanowania w CUDA: https://developer.nvidia.com/gpugems/GPUGems3/gpugems3_ch39.html W artykule położono nacisk na uczynienie skanowania „wydajnym”. Innymi słowy, algorytm GPU nie powinien wykonywać więcej dodatków niż algorytm CPU, O...

12
Synchronizacja kolejnych wywołań OpenGL Compute Shader

Mam kilka shaderów obliczeniowych, które należy wykonać w określonej kolejności i których wyniki zależą od poprzednich danych wejściowych. Idealnie, nigdy nie będę musiał kopiować bufora po stronie klienta i wykonywać całej mojej pracy na GPU. Rozważ, że mam dwa shadery obliczeniowe skompilowane i...

11
Na co czeka mój GPU?

Piszę program OpenCL do użytku z moim procesorem graficznym AMD Radeon z serii HD 7800. Według przewodnika programowania OpenCL AMD , ta generacja GPU ma dwie kolejki sprzętowe, które mogą działać asynchronicznie. 5.5.6 Kolejka poleceń W przypadku wysp południowych i późniejszych urządzenia...

9
Tworzenie wspólnych normalnych wierzchołków na GPU

Przeważnie udało mi się przenieść implementację Marching Cubes z CPU do shaderów obliczeniowych OpenGL, ale jeszcze nie poradziłem sobie z normami i zastanawiam się, jak to zrobić. Moja implementacja zajmuje się konkretnie polami o wartości binarnej (próbuję modelować funkcje fraktalne 3D, które...

9
Obliczenia według wierzchołków w tesselacji OpenGL

Próbuję zaimplementować symulację tkaniny w oparciu o pozycję za pomocą teselacji sprzętowej. Oznacza to, że chcę po prostu załadować kontrolny quad na kartę graficzną, a następnie użyć mozaiki i cieniowania geometrii, aby utworzyć węzły w tkaninie. Ten pomysł jest zgodny z dokumentem: Huynh,...