Czy smartd naprawdę zgłasza, że ​​ten dysk jest zbyt gorący?

9

„Atrybut użycia SMART: 194 Temperatura_Celsjusza zmieniona z 146 na 150”. To jest na CentOS 6.6.

Co to tak naprawdę znaczy? Czy dysk jest naprawdę gorący, czy może to błąd oprogramowania? Dysk jest dyskiem eSATA 2 TB i jest przyjemny w dotyku, a serwer w piwnicy ma 70F.

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9
Edward_178118
źródło

Odpowiedzi:

13

To tylko wartość atrybutu SMART. To nie jest temperatura w żadnej zwykłej jednostce. (bardziej przypomina liczbę między 255 (naprawdę bardzo zimno) a 0 (naprawdę bardzo gorąco), w zależności od dysku, co jest gorące, a co nie)

Jeśli chcesz zobaczyć temperaturę swojego dysku użyj smartctl -A /dev/sdx

Otrzymasz tabelę w ten sposób:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUE jest tym, czego szukasz ... (mój dysk jest dość ciepły w 45 ° C)

VALUEjest wartością atrybutu, a gdy spadnie poniżej THRESH, dysk przygotowuje się do żądania wymiany. (Nie wszystkie atrybuty mają próg, tak jak moja temperatura)

Jeśli chodzi o to, co jest gorące, a co nie, tak naprawdę zależy to od napędu. Istnieje nieco przestarzały artykuł od Google na temat wskaźników awarii dysków, który stwierdza, że ​​dyski o temperaturze około 40 ° C mają najniższe wskaźniki awarii (przynajmniej w Google i w 2007 r.). Pamiętam, jak czytałem inny artykuł (nie mogę go teraz znaleźć), który stwierdził, że wysoka temperatura nie stanowi problemu dla dysku twardego. Ostre i częste zmiany temperatury mogą spowodować wcześniejsze uszkodzenie dysku. Tak długo, jak temperatura dysku jest dość stabilna (możesz to monitorować za pomocą czegoś takiego jak Munin ), wszystko powinno być w porządku.

smartdzgłasza wszelkie zmiany atrybutów. To nie znaczy, że coś jest nie tak.

Lis
źródło
1
Dzięki. Patrz wyżej, zaktualizowałem to o wyjście smartctl. RAW_VALUE wynosi 40. To 40 stopni Celsjusza, czyli 104F. Czy to jest uważane za gorące? Lub robi się gorąco i rejestruje to, ponieważ może to być niebezpieczny trend? Ale Min / Max wynosi 20/49, więc nie brzmi, jakby przynajmniej było jeszcze za gorąco,
Edward_178118
1
@ Edward_178118 zaktualizował odpowiedź, mam nadzieję, że to pomoże.
Fox
Czyli wartości progowe 150 nie miały nic wspólnego z byciem 150C?
Edward_178118
Dokładnie. 150 byłoby zdecydowanie za gorąco. Nawet za gorąco, aby procesor, który się schłodził, pozostał poniżej 80 lub więcej.
Fox