Mam podwójny serwer Opteron z systemem Linux z libvirt do obsługi kilku maszyn wirtualnych. Maszyny wirtualne działają dobrze, a serwer działa OK, ale zauważam, że jeden procesor zawsze działa w temperaturze około 69 ° C (przepustnica w temperaturze 70 ° C), a drugi około 15 ° C.
To nie wydaje mi się normalne? Czy nie powinny być nieco bliżej temperatury?
Nie jestem pewien, jak dalej rozmyślać. Może na jednym z procesorów nie ma wystarczającej ilości pasty termicznej?
Edycja: płyta główna to ASUS KGPE-D16 i chłodzona przez dwa wentylatory Noctua NH-U9DO .
Zauważ, że uważam, że temperatury mogą być stopniowe powyżej temperatury otoczenia, a nie wartości bezwzględne? Gdy serwer jest na biegu jałowym, temperatura procesora spada do 2 ° C i 13 ° C. Korzystam z konfiguracji lmsensorów stąd
mpstat -P ALL 1
na Linuksie pomożeOdpowiedzi:
Problemem okazał się źle dopasowany radiator. Może źle dopasowany nie jest właściwym opisem. Okazuje się, że na radiator należy nałożyć pastę termiczną, a nie plastikową osłonę, która przechodzi nad radiatorem.
Po zdjęciu plastikowej osłony procesor jest ładny i fajny, dziękuję wszystkim!
źródło
Z mojego doświadczenia wynika, że sparowane elementy w obudowie działają w różnych temperaturach, ponieważ przepływ powietrza nie jest wszędzie taki sam. Oto wykres temperatury dysku twardego z mojego pudełka colo. Dyski są dublowane, więc obciążenia na nich są prawie identyczne.
Jak widać, śledzą się nawzajem, ale nie są takie same; są one również średnio w odstępie tylko 6C. Niezależnie od tego, czy czujniki zgłaszają temperaturę bezwzględną czy przegrzanie, różnica 55 ° C pod obciążeniem wydaje się bardzo błędna. Jeśli masz pewność, że dane są prawidłowe, to biorąc pod uwagę różnicę spoczynkową spada do 10 ° C, co jest różnicą, którą widzę z powodu przepływu powietrza, podejrzewam, że źle dopasowany radiator.
źródło
Nie jest. Chyba że masz poważne problemy z przepływem powietrza. Lub jedna z chłodnic jest zła. Temperatura BĘDZIE różna - ale nie tak bardzo (70 vs. 15 stopni Celsjusza).
Biorąc pod uwagę, jak niski jest 15 stopni, zakładam (a) że czujnik jest wyłączony (naprawdę przechowujesz serwer w tak chłodnym pomieszczeniu?).
Zakładam również, że jeden procesor po prostu nie działa, z jakiegokolwiek powodu.
Małe różnice są normalne. Niektóre mogą być większe (przepływ powietrza przychodzi mi do głowy). ale tutaj mówimy o jednym, który jest ZIMNY.
źródło
Może to być chłodzenie lub nierównomierne obciążenie (biorąc pod uwagę różnicę temperatur, Twoja sytuacja prawdopodobnie jest nierównomierna). Powinieneś użyć czegoś takiego jak prime95, aby równomiernie załadować wszystkie rdzenie i sprawdzić, czy temperatury nadal się różnią. Jeśli nie, musisz zrównoważyć maszyny wirtualne, sprawdź, czy aplikacje są wielowątkowe i zajęte. Jak to zrobić, zależy od twojego oprogramowania i indywidualnego obciążenia, więc tak naprawdę nie wchodzi w zakres pytania. Pamiętaj, że nie ma realnej korzyści, jeśli nie masz wystarczającej ilości obciążenia, aby uzupełnić pojedynczy procesor / rdzeń, w rzeczywistości Twoja maszyna wirtualna może celowo unikać używania drugiej jednostki centralnej, aby mogła przejść do trybów oszczędzania energii na wielu systemy CPU.
Jeśli zawęziłeś to do chłodzenia. Mała różnica do 10 ° C może być za małą (lub za dużą!) Pastą termiczną. Większa różnica wskazuje na poważny problem lub różnicę między chłodzeniem procesora. Możliwe, że zablokowano przepływ powietrza, luźny radiator itp.
źródło
Musiałbym się zgodzić z wadliwą temperaturą. czujnik, ponieważ 15C to tylko 59F !!! Chyba że komputer znajduje się w wyjątkowo mroźnym centrum danych, wyobrażam sobie, że temperatura powietrza otoczenia byłaby wyższa niż 59F! Próbujesz przypisać maszyny wirtualne do rdzenia niskotemperaturowego i sprawdzić, czy jest jakaś zmiana; jeśli nie, podejrzewam, że czujnik jest wadliwy.
Możesz także spojrzeć na wynik
dmesg
(komunikaty rozruchowe) i sprawdzić, czy jest tam coś niezwykłego.źródło