Dlaczego w Prime95 małe FFT generują najwięcej ciepła pomimo procesora na poziomie 100% dla wszystkich opcji?

9

Właśnie zbudowałem nowy komputer Skylake i zamierzam trochę podkręcić z Prime95 jako testerem warunków skrajnych.

Działa dobrze podczas normalnego użytkowania, ale w przypadku Prime95 zauważam, że procesor dławi się pod niektórymi obciążeniami.

Jeśli wszystkie 4 rdzenie (8 wątków) są zablokowane na 100% niezależnie od tego, dlaczego ustawienie Small FFT w Prime95 osiąga wyższą temperaturę niż opcja „Mieszanie”?

ChrisA
źródło

Odpowiedzi:

13

Kod wektorowy, zwłaszcza AVX, naturalnie zwiększa moc cieplną procesora, ponieważ procesor musi działać przy wyższym napięciu, aby wykonać te instrukcje. Małe FFT wymagają mniej pamięci niż tryb mieszany, więc procesor spędza więcej czasu na przetwarzaniu danych i mniej czasu na dane.

  • Architektura x86-64 zapewnia szerokie możliwości przetwarzania wektorowego , szczególnie w najnowszych procesorach. Przetwarzanie wektorowe pozwala aplikacjom wykonywać operacje matematyczne na wielu elementach danych jednocześnie i jest wykorzystywane przez wiele nowszych aplikacji intensywnie obliczeniowych w celu zwiększenia przepustowości przetwarzania.

  • Kod wektorowy, w szczególności instrukcje AVX używane przez Prime95, wymaga, aby procesor pracował przy wyższym napięciu niż normalnie. Skutkuje to zużyciem energii i mocą cieplną większą niż przy normalnym obciążeniu pracą. Z tego powodu Intel ostrzega, że ​​duże obciążenia AVX mogą powodować dławienie procesora lub nie utrzymywać pełnej częstotliwości taktowania Turbo Boost (przypis 1):

    Zaawansowane rozszerzenia wektorowe Intel® (Intel® AVX) zostały zaprojektowane w celu uzyskania wyższej przepustowości dla niektórych operacji na liczbach całkowitych i zmiennoprzecinkowych. Z powodu różnych charakterystyk mocy procesora, stosowanie instrukcji AVX może spowodować, że a) niektóre części będą pracowały z częstotliwością niższą niż częstotliwość znamionowa oraz b) niektóre części z technologią Intel® Turbo Boost 2.0 nie osiągną żadnej lub maksymalnej częstotliwości turbo.

    Intel wyjaśnia to bardziej szczegółowo w tej białej księdze . W szczególności odnotowuje:

    Intel AVX został zaprojektowany w celu uzyskania wyższej przepustowości dla niektórych operacji na liczbach całkowitych i zmiennoprzecinkowych. Korzystanie z tych instrukcji może spowodować, że procesory będą działać z częstotliwością mniejszą niż oznaczona częstotliwość TDP. Te redukcje częstotliwości występują, ponieważ instrukcje Intel AVX dużej mocy wymagają dodatkowego napięcia i prądu elektrycznego.

    • Domyślam się, dlaczego zwiększenie V rdzenia jest konieczne dla instrukcji AVX, ponieważ jednostki wykonawcze AVX są bardziej złożone niż inne części procesora, co powoduje, że odpowiednie etapy potoku trwają dłużej (zobacz tę odpowiedź, aby uzyskać więcej informacji technicznych na temat potoków i inne aspekty projektowania procesorów). Jeśli dany etap potoku jest wolny, maksymalna częstotliwość taktowania całego procesora jest ograniczona, ponieważ każdy etap potoku musi kończyć się w każdym cyklu zegara.

    • Z tego samego powodu wyższe napięcia zwiększają maksymalne osiągalne częstotliwości podczas podkręcania (tranzystory mogą przełączać się szybciej przy wyższych napięciach), zwiększenie napięcia pomaga zapewnić, że dłuższe etapy rurociągu mogą zakończyć się na czas.

  • Tryb Small FFT wykorzystuje tylko mniejsze elementy danych, które mogą zmieścić się w pamięci podręcznej procesora , w przeciwieństwie do trybu mieszania, który działa zarówno na małych, jak i dużych wartościach, które mogą nie zmieścić się w pamięci podręcznej. Ponieważ dostęp do pamięci jest powolny w porównaniu do zwykłego przetwarzania danych, procesor poświęci mniej czasu na przetwarzanie danych w trybie mieszania, zmniejszając moc cieplną. Małe FFT nie wymagają prawie tak dużej ilości dostępów do pamięci, co powoduje bardziej rzeczywistą pracę procesora, zwiększając w ten sposób zużycie energii i moc cieplną.

bwDraco
źródło
Dzięki @DragonLord, dzięki temu różne tryby Prime95 są bardzo wyraźne. Czy możesz uściślić swoją odpowiedź, aby wyjaśnić, dlaczego monitor zasobów czyta 100% w obu przypadkach? Dlaczego nie odczytuje mniej niż 100% w trybie mieszania, na przykład, jeśli czeka na dane więcej czasu niż w trybie Small FFT?
ChrisA
1
Procesor zajęty czekaniem na pamięć jest nadal zgłaszany jako zajęty w systemie operacyjnym, jak rozumiem.
bwDraco