Dlaczego AMD umieszczając dysk SSD na karcie graficznej tak bardzo zmniejszyło opóźnienia?

AMD ostatnio informowało o interesującej płycie Radeon Pro z kilkoma dyskami SSD M2.

Jak zauważają niektóre bardziej szczegółowe historie ( na przykład tutaj lub tutaj ), korzyści mogą zasadniczo nie wynikać z dużej przepustowości (M2 są po prostu na 4 liniach PCIe, więc własne złącze 16 linii powinno mieć więcej), ale z małym opóźnieniem. Ta historia zawiera stwierdzenie „powoduje to 10-krotnie mniejsze opóźnienie dostępu do pamięci”.

Moje pytanie jest w gruncie rzeczy: dlaczego dyski SSD podłączone do PCIe na płycie GPU mają znacznie mniejsze opóźnienie niż GPU uzyskujący dostęp do głównej pamięci RAM systemu lub urządzeń pamięci masowej na szynie PCIe? Co takiego jest w głównym systemie, który „przeszkadza” i oznacza, że dostęp do wbudowanego dysku SSD jest znacznie szybszy?

gpu performance hardware czas
źródło

Może ominąć system operacyjny / sterownik

RichieSams

@RichieSams: Ciekawe; czy to oznacza w zasadzie, że ktoś mógłby osiągnąć podobny wynik, uzyskując dostęp do dedykowanego dysku SSD PCIe przez magistralę systemową? (Nie wiem, w jakim stopniu główny ruch PCIe w systemie wymaga obsługi systemu operacyjnego przez urządzenia w celu komunikacji lub czy mogą to zrobić bardziej autonomicznie po skonfigurowaniu).

dzisiaj

@ częściowo częściowo dzisiaj, ale nadal będzie narzut, ponieważ trzeba będzie czekać na swoją kolejkę od graficznych kontrolerów

joojaa

Odpowiedzi:

Odpowiadając z perspektywy laika (nie jestem ekspertem od sprzętu, ale zbudowałem własny komputer), dokonam analogii, wykorzystując sytuację, w której zdobywam składniki do gotowania.

Używanie pamięci RAM / pamięci „głównego systemu” jest jak szukanie składnika, nie znajdowanie go w szafkach i, powiedzmy, podchodzenie do sąsiada i pytanie, czy ma jakiś. Okazuje się, że tak; przynoszą ci to, dziękujesz im i wracasz do domu i korzystasz z niego.

Używanie „wbudowanej” pamięci RAM / pamięci przypomina szukanie składnika, znajdowanie go w szafce i używanie go.

Dzięki wbudowanej pamięci RAM / pamięci procesor graficzny musi po prostu wykonać mniej pracy, aby uzyskać potrzebne informacje. Informacje są również po prostu bliższe, zarówno fizycznie, jak i biorąc pod uwagę ilość sprzętu i oprogramowania, przez które informacje muszą przejść. Dzięki wbudowanej pamięci RAM / pamięci procesor GPU musi tylko sprawdzić, gdzie znajdują się informacje, a następnie pobrać te informacje z pamięci RAM / pamięci, która następnie przesuwa się może o kilka centymetrów drutu do procesorów GPU.

W przypadku pamięci RAM / pamięci głównego systemu istnieje większa odległość drutu, przez który przechodzi sygnał, który, choć może to być zaledwie ułamek sekundy, może w dalszym ciągu zsumować tysiące połączeń w celu uzyskania informacji. Ponadto istnieje więcej potencjalnych wąskich gardeł, z wszystkimi różnymi połączonymi elementami.

Wreszcie dzięki wbudowanej pamięci RAM / pamięci AMD ma możliwość optymalizacji systemu, ponieważ precyzyjnie kontroluje sprzęt. To tak, jak Apple dostosowuje Mac OS do swoich komputerów Mac.

Ben Sandeen
źródło