Niedawno rozmawiałem z przyjacielem o kompilacji LaTeX. LaTeX może używać tylko jednego rdzenia do kompilacji. Zatem dla szybkości kompilacji LaTeX najważniejsza jest szybkość zegara procesora (patrz Wskazówki dotyczące wyboru sprzętu zapewniającego najlepszą wydajność kompilacji LaTeX )
Z ciekawości szukałem procesorów o najwyższych częstotliwościach zegara. Myślę, że to Intel Xeon X5698 z 4,4 GHz ( źródło ) miał najwyższą częstotliwość zegara.
Ale to pytanie nie dotyczy sprzedawanych procesorów. Chciałbym wiedzieć, jak szybko to może osiągnąć, jeśli nie zależy ci na cenie.
Jedno pytanie brzmi: czy istnieje fizyczny limit szybkości procesora? Jak to jest wysoko?
Drugie pytanie brzmi: jaka jest jak dotąd najwyższa osiągnięta prędkość procesora?
Zawsze uważałem, że szybkość procesora jest ograniczona, ponieważ chłodzenie (tak ciepło ) staje się tak trudne. Ale mój przyjaciel wątpi, że to jest powód (kiedy nie musisz używać tradycyjnych / tanich systemów chłodzenia, np. W eksperymencie naukowym).
W [2] przeczytałem, że opóźnienia transmisji powodują kolejne ograniczenie szybkości procesora. Nie wspominają jednak o tym, jak szybko można to osiągnąć.
Co znalazłem
- [1] Naukowcy uważają, że podstawowe maksymalne ograniczenie szybkości procesorów : Wydaje się, że dotyczą tylko komputerów kwantowych, ale to pytanie dotyczy „tradycyjnych” procesorów.
- [2] Dlaczego istnieją ograniczenia szybkości procesora?
O mnie
Jestem studentem informatyki. Wiem coś o procesorze, ale nie za dużo. A jeszcze mniej na temat fizyki, która może być ważna dla tego pytania. Jeśli to możliwe, pamiętaj o tym, udzielając odpowiedzi.
Odpowiedzi:
Praktycznie tym, co ogranicza szybkość procesora, jest zarówno wytwarzane ciepło, jak i opóźnienie bramki, ale zwykle ciepło staje się znacznie większym problemem, zanim ten drugi się uruchomi.
Najnowsze procesory są produkowane przy użyciu technologii CMOS. Za każdym razem, gdy występuje cykl zegara, energia jest rozpraszana. Dlatego wyższe prędkości procesora oznaczają większe rozpraszanie ciepła.
http://en.wikipedia.org/wiki/CMOS
Oto kilka liczb:
Naprawdę możesz zobaczyć, jak zwiększa się moc przejścia procesora (wykładniczo!).
Ponadto pojawiają się pewne efekty kwantowe, gdy rozmiar tranzystorów zmniejsza się. Na poziomie nanometrów bramki tranzystorów stają się „nieszczelne”.
http://computer.howstuffworks.com/small-cpu2.htm
Nie będę się tutaj zastanawiał, jak ta technologia działa, ale jestem pewien, że możesz użyć Google do wyszukiwania tych tematów.
Okej, teraz opóźnienia transmisji.
Każdy „drut” wewnątrz procesora działa jak mały kondensator. Również podstawa tranzystora lub bramka MOSFET działają jak małe kondensatory. Aby zmienić napięcie na połączeniu, należy albo naładować przewód, albo usunąć ładunek. Gdy tranzystory kurczą się, staje się to trudniejsze. Właśnie dlatego SRAM potrzebuje tranzystorów wzmacniających, ponieważ tak naprawdę tranzystory z macierzą pamięci są tak małe i słabe.
Od: Jak zaimplementować wzmacniacz SRAM sens?
Zasadniczo chodzi o to, że trudniej jest, gdy małe tranzystory muszą napędzać interkonekty.
Istnieją również opóźnienia bramy. Nowoczesne procesory mają ponad dziesięć etapów potoku, może nawet do dwudziestu.
Problemy z wydajnością w rurociągach
Istnieją również efekty indukcyjne. Przy częstotliwościach mikrofalowych stają się dość znaczące. Możesz poszukać przesłuchu i tego typu rzeczy.
Teraz, nawet jeśli uda ci się uruchomić procesor 3265810 THz, kolejnym praktycznym ograniczeniem jest szybkość, z jaką reszta systemu może go obsługiwać. Musisz mieć pamięć RAM, pamięć masową, logikę klejową i inne połączenia, które działają równie szybko, albo potrzebujesz ogromnej pamięci podręcznej.
Mam nadzieję że to pomoże.
źródło
Power = Frequency ^ 1.74
.Problem ciepła jest dobrze pokryty przez puszyste włosy. Podsumowując opóźnienia transmisji, zastanów się nad tym: Czas potrzebny na przejście sygnału elektrycznego przez płytę główną to więcej niż jeden cykl zegara nowoczesnego procesora. Tak więc tworzenie szybszych procesorów nie osiągnie wiele.
Superszybki procesor jest naprawdę korzystny tylko w przypadku masowych procesów polegających na łamaniu liczb, a następnie tylko wtedy, gdy kod jest starannie zoptymalizowany, aby działał w układzie scalonym. Jeśli często trzeba szukać gdzie indziej danych, marnuje się dodatkową prędkość. W dzisiejszych systemach większość zadań może być wykonywana równolegle, a duże problemy są podzielone na wiele rdzeni.
Wygląda na to, że proces kompilacji lateksu zostałby ulepszony przez:
źródło
Istnieją trzy ograniczenia fizyczne: ciepło, opóźnienie bramki i prędkość transmisji elektrycznej.
Rekord świata w najwyższej jak dotąd częstotliwości zegara (według tego linku) 8722.78 MHz
Prędkość transmisji elektrycznej (mniej więcej taka sama jak prędkość światła) jest bezwzględnym ograniczeniem fizycznym, ponieważ żadne dane nie mogą być przesyłane szybciej niż ich medium. Jednocześnie limit ten jest bardzo wysoki, więc zwykle nie jest czynnikiem ograniczającym.
Procesory składają się z ogromnej liczby bramek, z których całkiem sporo jest połączonych szeregowo (jedna po drugiej). Przejście ze stanu wysokiego (np. 1) do stanu niskiego (np. 0) lub odwrotnie zajmuje trochę czasu. To opóźnienie bramy. Więc jeśli masz 100 bramek połączonych szeregowo, a jedna wymaga przełączenia 1 ns, będziesz musiał poczekać co najmniej 100 ns, aby całość mogła dać ci prawidłowy wynik.
Przełączniki te zużywają najwięcej mocy procesora. Oznacza to, że jeśli zwiększysz częstotliwość zegara, otrzymasz więcej przełączników, a tym samym zużyjesz więcej energii, a tym samym zwiększysz moc cieplną.
Przepięcie (=> zapewnienie większej mocy) nieco zmniejsza opóźnienie bramki, ale ponownie zwiększa moc cieplną.
Gdzieś w okolicach 3 GHz zużycie energii do taktowania niezwykle wzrasta. Właśnie dlatego procesory 1,5 GHz mogą działać na smartfonie, podczas gdy większość procesorów 3-4 GHz nie może nawet działać na laptopie.
Ale Szybkość zegara nie jest jedyną rzeczą, która może przyspieszyć procesor, również optymalizacje w potoku lub architektura mikrokodu mogą spowodować znaczne przyspieszenie. Właśnie dlatego 3 GHz Intel i5 (Dualcore) jest wielokrotnie szybszy niż 3 GHz Intel Pentium D (Dualcore).
źródło
źródło
To zależy w dużej mierze od samego procesora. Tolerancje produkcyjne powodują, że fizyczny limit jest nieco inny dla każdego układu, nawet z tego samego płytki.
To dlatego, że
transmission delay
lubspeed path length
jest wyborem dla projektanta układu. W skrócie, to ile pracy logika wykonuje w jednym cyklu zegara . Bardziej złożona logika powoduje wolniejsze maksymalne częstotliwości taktowania, ale także zużywa mniej energii.Dlatego chcesz użyć testu porównawczego do porównania procesorów. Praca na numery cyklów jest bardzo różna, więc porównanie surowego MHz może dać zły pomysł.
źródło
Praktycznie jest to energia cieplna, która jest w przybliżeniu proporcjonalna do kwadratu napięcia: http://en.wikipedia.org/wiki/Thermal_design_power#Overview Każdy materiał ma swoją specyficzną pojemność cieplną, która ogranicza wydajność chłodzenia.
Nie biorąc pod uwagę problemów technicznych związanych z opóźnieniem chłodzenia i transmisji, znajdziesz prędkość światła ograniczającą odległość, jaką sygnał może pokonać w naszym procesorze na sekundę. Dlatego procesor musi uzyskać samller, im szybciej działa. Wreszcie, działa on powyżej określonej częstotliwości, procesor może stać się przezroczysty dla funkcji fal elektronicznych (elektrony modelowane jako funkcje falowe zgodnie z równaniem Schroingerera).
W 2007 r. Niektórzy fizycy obliczyli podstawowe ograniczenie prędkości roboczych:http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.99.110502
źródło
Oprócz wszystkich innych odpowiedzi, istnieje również kilka innych czynników, które mogą nie wpływać bezpośrednio na szybkość procesora, ale utrudniają budowanie czegokolwiek wokół tego procesora;
Krótko mówiąc, powyżej prądu stałego częstotliwość radiowa staje się problemem. Im szybciej jedziesz, tym bardziej skłonni jest działać jak gigantyczne radio. Oznacza to, że ślady na płytkach drukowanych ulegają przesłuchowi, skutkom ich własnej pojemności / indukcyjności z sąsiednimi ścieżkami / płaszczyzną uziemienia, hałasem itp. Itd.
Im szybciej jedziesz, tym gorzej to robi - nogi komponentów mogą na przykład wprowadzić niedopuszczalną indukcyjność.
Jeśli spojrzysz na wytyczne dotyczące układania „podstawowych” płytek drukowanych na poziomie Raspberry Pi z pewną pamięcią DDR RAM, wszystkie ślady magistrali danych itp. Muszą być równej długości, mieć prawidłowe zakończenie itp. I to jest działa znacznie poniżej 1GHz.
źródło