Czy poniższe stwierdzenie oznacza, że ​​mój dysk SSD może ulec awarii?

2
    [iceguru@stuxnet ~]$ sudo smartctl -a /dev/sda
smartctl 6.3 2014-07-26 r3976 [x86_64-linux-3.14.21-1-MANJARO] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Intel 520 Series SSDs
Device Model:     INTEL SSDSC2CW120A3
Serial Number:    CVCV203503C7120BGN
LU WWN Device Id: 5 001517 bb2812260
Firmware Version: 400i
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sat Oct 18 12:02:07 2014 CDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        ( 2097) seconds.
Offline data collection
capabilities:            (0x7f) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Abort Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (  48) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x0021) SCT Status supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   000   000   000    Old_age   Always       -       895808h+42m+44.030s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       72
170 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       63
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x000f   120   120   050    Pre-fail  Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       63
225 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       15323
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       65535
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       37
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       65535
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   100   100   000    Old_age   Always       -       0
241 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       15323
242 Host_Reads_32MiB        0x0032   100   100   000    Old_age   Always       -       9317
249 NAND_Writes_1GiB        0x0013   100   100   000    Pre-fail  Always       -       564

SMART Error Log not supported

SMART Self-test Log not supported

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
IceGuru
źródło

Odpowiedzi:

2

W opublikowanych danych SMART nie ma nic, co wskazywałoby, że dysk jest prawie w stanie awarii.

Przyjrzyjmy się temu raportowi bardziej szczegółowo. Oto pierwsza wskazówka, że ​​SMART nie znalazł żadnych krytycznych problemów typu „utrata danych jest nieuchronna”:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Gdyby SMART uznał porażkę za nieuchronną, wynik testu samooceny ogólnego stanu zdrowia nie byłby PASSED, ale coś bardziej złowieszczego.

Przechodząc do tabeli SMART Atrybuty, zwróć uwagę na brak czegokolwiek w kolumnie WHEN_FAILED. Oznacza to, że żadna z wartości atrybutów nie została (lub nigdy) przekroczona powyżej zdrowych progów. Jeśli jakieś wartości przekroczą (lub przekroczyły) próg krytyczny, zobaczysz coś podobnego FAILING_NOWlub IN_THE_PASTtam, zamiast wartości pustych (reprezentowanych przez łączniki).

Powiedziawszy to wszystko, niekoniecznie powinieneś wziąć dobrze wyglądający raport SMART jako 100% dowód, że dysk nie ulegnie awarii. Dyski dowolnego typu mogą nagle ulec awarii w dowolnym momencie, na długo przed pojawieniem się jakichkolwiek oznak problemów w atrybutach SMART. Innymi słowy, weź dobry raport atrybutów SMART jako dowód zdrowego popędu, a nie jako absolutny dowód tego. Jeśli dane nie mogą zostać utracone, musisz mieć dobrą strategię tworzenia kopii zapasowych.

Steven Monday
źródło
Dostaję błędy blokowania podczas uruchamiania i wyłączania. Stąd moje zmartwienie.
IceGuru,