Błędy sprzętowe procesora w systemie Ubuntu 17.04

12

Czy ktoś może mi wyjaśnić, jakie te komunikaty o błędach otrzymałem, gdy spojrzałem na dmesg? Jestem nowy w Ubuntu i Linux World.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Używam Ubuntu 17.04 z jądrem 4.10.0-29-generic

M.Voyles
źródło
lub jest to błąd oprogramowania Mam to samo w swoim dzienniku nowego Lenovo T480S patrz bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Odpowiedzi:

8

Procesor się przegrzewa i przechodzi w MCE (zdarzenia sprawdzania komputera) ... tzn .: ulega awarii. Jeśli nie widzisz innych zdarzeń związanych z temperaturą w syslog, jest to prawdopodobnie spowodowane tym, że Twój procesor / wentylator / rurka termiczna / pasta termiczna nie wykonuje pracy.

  • Sprawdź syslog za pomocą tego terminalpolecenia ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Jeśli urządzenie jest bardzo brudne / zakurzone, może to odgrywać główną rolę w przegrzaniu urządzenia. Wyczyść to.

  • Jeśli twoje urządzenie ma procesory Intel, upewnij się, że intel-microcodejest zainstalowane.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Zainstaluj, thermaldaby spróbować kontrolować temperaturę.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Sprawdź swoją wersję systemu BIOS. Wejdź do BIOS w momencie włączenia zasilania i zanotuj wersję #. Przejdź do strony producenta z marką / modelem komputera. Przejdź do sekcji wsparcia / pobierania i sprawdź, czy jest nowy BIOS.

  • Wreszcie, co jest bardzo prawdopodobne, jeśli jest to starsza maszyna, należy ponownie nałożyć mieszankę termiczną, która znajduje się między procesorami a jej chłodnicą / wentylatorem. Wymaga to doświadczenia technicznego.

heynnema
źródło
1
Jaki wpływ ma to intel-micorocodena temperaturę?
gene_wood
@gene_wood, jak już wspomniałem, to prawdopodobnie problem z pyłem, wentylatorem lub związkiem termicznym, a sprawdzenie mikrokodu to tylko kolejny krok w zdalnej diagnozie problemu. Procesor działający na starym mikrokodzie może powodować różne problemy. Sekundy, aby to sprawdzić.
heynnema