Procesory mają funkcję dynamicznego zmniejszania prędkości zgodnie z ich temperaturą, aby uniknąć przegrzania. W pracy mam dwa serwery, z których jeden wykazuje złe zachowanie (losowe ponowne uruchomienie).
Poniższy fragment kodu znajduje się w dziennikach systemowych obu komputerów. Czy jest to konsekwencja normalnego działania dynamicznego skalowania częstotliwości procesora, czy może wskazuje to na jakiś błąd (np. Niewłaściwe zastosowanie pasty cieplnej)?
Spodziewałbym się, że coś tak przyziemnego jak dynamiczne skalowanie częstotliwości nowoczesnego procesora nie pojawi się w logach systemowych.
Na marginesie: nie dokonano ani nie próbowano przetaktowywania w żadnym momencie czasu serwerów z nami.
The kernel log indicates that hardware errors were detected.
System log may have more information.
The last 20 mcelog lines of system log are:
==========================================
Jan 31 17:13:12 apollo3 mcelog: Family 6 Model 4f CPU: only decoding architectural errors
Feb 2 15:07:50 apollo3 mcelog: Family 6 Model 4f CPU: only decoding architectural errors
Feb 2 15:07:50 apollo3 mcelog: Hardware event. This is not a software error.
Feb 2 15:07:50 apollo3 mcelog: MCE 0
Feb 2 15:07:50 apollo3 mcelog: CPU 1 THERMAL EVENT TSC 15900247053fc
Feb 2 15:07:50 apollo3 mcelog: TIME 1486044329 Thu Feb 2 15:05:29 2017
Feb 2 15:07:50 apollo3 mcelog: Processor 1 heated above trip temperature. Throttling enabled.
Feb 2 15:07:50 apollo3 mcelog: Please check your system cooling. Performance will be impacted
Feb 2 15:07:50 apollo3 mcelog: STATUS 88000bcb MCGSTATUS 0
Feb 2 15:07:50 apollo3 mcelog: MCGCAP 7000c16 APICID 4 SOCKETID 0
Feb 2 15:07:50 apollo3 mcelog: CPUID Vendor Intel Family 6 Model 79
Feb 2 15:07:50 apollo3 mcelog: Family 6 Model 4f CPU: only decoding architectural errors
Feb 2 15:07:50 apollo3 mcelog: Hardware event. This is not a software error.
Feb 2 15:07:50 apollo3 mcelog: MCE 1
Feb 2 15:07:50 apollo3 mcelog: CPU 1 THERMAL EVENT TSC 15900247241ad
Feb 2 15:07:50 apollo3 mcelog: TIME 1486044329 Thu Feb 2 15:05:29 2017
Feb 2 15:07:50 apollo3 mcelog: Processor 1 below trip temperature. Throttling disabled
Feb 2 15:07:50 apollo3 mcelog: STATUS 88010a8a MCGSTATUS 0
Feb 2 15:07:50 apollo3 mcelog: MCGCAP 7000c16 APICID 4 SOCKETID 0
Feb 2 15:07:50 apollo3 mcelog: CPUID Vendor Intel Family 6 Model 79
cpu
cooling
temperature
error-logging
Dohn Joe
źródło
źródło
Odpowiedzi:
Jak mówi - procesor się przegrzewa.
Wyczyść i sprawdź wszystkie wentylatory, jeśli działają poprawnie
Zmień pastę grzewczą (lub jeśli nadal jest objęta gwarancją, przejdź do C)
Skontaktuj się z producentem, jeśli problem nadal występuje
źródło