Szybka metoda określenia kondycji dysku SSD?

13

Mam dysk Intel X-25M, który został dwukrotnie oznaczony jako „uszkodzony” w macierzy pamięci ZFS, jak wspomniano tutaj . Jednak po wyjęciu napędu wydaje się montować, odczytywać i zapisywać na innych komputerach (Mac, PC, obudowa USB itp.)

Czy istnieje dobry sposób na określenie aktualnego stanu dysku? Wydaje mi się, że poprzednią porażką w rozwiązaniu ZFS była konwergencja błędów, zgłaszanie złych błędów i sprzęt. Wygląda na to, że ten dysk może mieć trochę życia.

ewwhite
źródło
czy to jest g1 czy g2?
Jim B
To jest dysk G2 120 GB X25-M.
ewwhite

Odpowiedzi:

12

Dobrym, ale nie niezawodnym sposobem sprawdzania kondycji dysku jest sprawdzenie atrybutów SMART.

Poniżej znajduje się zestaw atrybutów SMART dla dysku Intel X25-M G2 160 GB, pobrany za pomocą smartctl v5.41. (Wersja jest ważna, wcześniejsze wersje smartctl miały różne odwzorowania nazw atrybutów i właściwie nie rozumiały konkretnej tabeli dla tego napędu).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

To pokazuje, że dysk miał 1 przeniesiony sektor, zużył 1% dostępnej zarezerwowanej przestrzeni (atrybut 232) i 2% prognozowanych cykli programowania / kasowania (atrybut 233). Zapisano mu 148418 * 32 MB (atrybut 225).

Jeśli dysk pokazuje jakąkolwiek znaczną liczbę realokowanych sektorów, może to być powodem do niepokoju, ponieważ prawdopodobnie wskazuje to na wadliwy układ flash (w ten sam sposób, w jaki znaczna liczba realokowanych sektorów na wirującym dysku ogólnie wskazuje na błędy powierzchniowe ). End-to-end są również złe - miałem kilka awarii X25-M G2 160GB z dużymi (> 1000) raportami błędów End-End. Istnieją jednak naprawdę dwa przydatne atrybuty warunku błędu dla tych dysków, ponieważ większość przydatnych atrybutów SMART dla normalnych dysków nie ma zastosowania do dysków SSD.

Jednak SMART nie jest ogólnie uważany za w 100% niezawodny. Badanie Google dotyczące awarii dysków wykazało, że chociaż istniały dobre korelacje między różnymi wskaźnikami wczesnego ostrzegania SMART a awarią dysku, nie było to przydatne narzędzie do przewidywania awarii poszczególnych dysków. Z tego powodu zwykle używam SMART jako sposobu na udowodnienie, że dysk jest zły (jeśli pojawiają się błędy, prawdopodobnie wkrótce się nie powiedzie), zamiast udowadniać, że dysk jest nadal dobry.

Daniel Lawson
źródło
1
Należy zauważyć, że badanie Google koncentrowało się na wskazaniach SMART sprzed awarii, które okazały się mniej niż wiarygodne. Raportowanie warunków awarii jest nieco dokładniejsze.
Chris S
2

Chociaż narzędzie „badblocks” zostało stworzone z myślą o „tradycyjnych” dyskach twardych, może przynieść pewne korzyści, ponieważ służy do wykonywania wszystkich sektorów możliwych do zmapowania na dysku. Dzięki zapobieganiu fragmentacji dysku SSD i wewnętrznym zmianom map nie będzie można stwierdzić, że dysk jest dobry. Jeśli jednak powie ci, że dysk jest zły, z pewnością wyrzucę go jako martwy.

bot403
źródło
1

HD Tune (i HD Tune Pro ) to świetne narzędzia do pomiaru stanu i wydajności dysku SSD. Darmowa wersja (HD Tune) ma bardzo ograniczony zestaw funkcji, ale analiza zdrowia mieści się w tym, więc masz szczęście. Wersja Pro ma 15-dniowy okres próbny, który zdecydowanie polecam wypróbować, zapewni świetną, dogłębną analizę wydajności twojego dysku SSD.

András Szepesházi
źródło