Jak interpretować wyniki HDD SMART?

58

Mój laptop ostatnio stał się trochę niewiarygodny iz jakiegoś powodu zacząłem podejrzewać, że mój dysk twardy zaczyna się zawodzić. Po polowaniu w Internecie znalazłem Narzędzie dyskowe Ubuntu w menu System i uruchomiłem z niego długą diagnostykę SMART.

Ponieważ jednak dokumentacja narzędzia dyskowego jest bardzo słaba ( palimpsest?), Nie jestem pewien, jak interpretować wyniki:

Wartość ponad 50 milionów za wskaźnik błędu odczytu, ale test jest dobry ?!

Na przykład wskaźnik błędu odczytu wynosi ponad 50 milionów (!), Ale ocena jest oceniana jako „dobra”.

Czy ktoś mógłby mi wyjaśnić, jak interpretować wyniki tych testów (zwłaszcza liczby znormalizowane, najgorsze, wartości progowe i wartości)? A może powiedz mi, co sądzą o wynikach, jakie uzyskałem dla mojego dysku twardego? (Dzięki)

Marty
źródło
Czy „Odzyskane ECC sprzętu” ma taką samą wartość jak „Odczyt poziomu błędu”? Mój dysk ma 676 cykli zasilania, był zasilany przez 285 dni i ma 193M błędów. W porównaniu do mojego, twój dysk ma o wiele za dużo błędów, ale spekuluję tutaj. W każdym razie po prostu się martwiłem oO
danizmax
Yip - obie liczby są takie same!
Marty

Odpowiedzi:

54

Masz dobry opis działania SMART na Wikipedii . Ale krótkie wprowadzenie:

  • Wartość: jest to surowa wartość zgłaszana przez kontroler. Zwykle jest to wartość łatwa do zrozumienia (np. Moc w godzinach lub temperatura), ale czasami nie jest (jak wskaźnik błędu odczytu). Różni producenci mogą używać różnych struktur i znaczeń dla tych danych.

  • Znormalizowana: jest to powyższa wartość znormalizowana, więc wyższa wartość jest zawsze lepsza. Zatem wskaźnik odczytu / błędów wynoszący 114 jest lepszy niż 113. Ponownie, sposób, w jaki dysk twardy konwertuje surowe dane na znormalizowaną wartość, zależy od dostawcy.

  • Najgorsze: najgorsza znormalizowana wartość, jaką miał Twój dysk w przeszłości (gdzie 99 jest prawdopodobnie ustawieniem fabrycznym).

  • Próg: gdy znormalizowana wartość jest niższa od tej wartości, napęd prawdopodobnie zawiedzie.

Twój dysk twardy wydaje się być w porządku. Wartość wskaźnika błędów odczytu nie dotyczy czasu awarii dysku, ale pewną strukturę danych, która zależy od producenta dysku.

Javier Rivera
źródło
jeśli konkretny dysk nie zgłasza znormalizowanej wartości, to czy to oznacza, że najgorsze i próg zostanie zgłoszony w kategoriach, czy też wszystkie napędy używają znormalizowanych wartości i tylko niektórzy decydują się oznaczyć je jako „wartość”?
DeveloperACE
25

Tak, generalnie surowa wartość wskaźnika błędu odczytu jest nonsensowna. Wartości, na które chcesz uważać, to ponownie przydzielona liczba sektorów, liczba oczekujących i niemożliwa do korekty offline. Są to liczby złych sektorów, które zostały, czekają na lub nie mogą zostać poprawione, a surowe wartości tam na ogół mają sens i są liczbą sektorów.

Jeśli odczyt sektora nie powiedzie się, staje się w toku. Następnym razem, gdy spróbujesz napisać do tego sektora, dysk spróbuje go przepisać, a jeśli to zadziała, wszystko wróci do normy. Jeśli nie będzie w stanie poprawnie zapisać sektora, przeniesie sektor z rezerwowej puli. Jeśli nie jest w stanie tego zrobić (może już zużył już pulę zapasową?), Staje się po prostu offline_uncorrectable, a próba odczytu lub zapisu powoduje po prostu błędy.

psusi
źródło
1
Mam dysk, który prawie całkowicie nie spełnia poziomu błędu odczytu surowego. Test kończy się niepowodzeniem dopiero po pewnym czasie działania dysku, może 15 minut; w systemie Windows symptomem jest to, że jakikolwiek dostęp do dysku zawiesza proces, więc używam narzędzi Ubuntu, aby określić, co jest nie tak, ale nie mam pewności, co mówi, że to nie tak z dyskiem, ponieważ wskaźnik błędów odczytu nie „ Wydaje się, że wskazuje to na jakąkolwiek nieuchronną awarię napędu - jednak napęd zdecydowanie ma problemy!
Michael
Powinienem również dodać, że same wyniki testów są niejednoznaczne. Ogólny test mówi, że nie powiódł się, ale test poziomu błędu odczytu, mimo że ma absurdalną wartość (100/100, najgorszy, znormalizowany) mówi „Ok”.
Michael
9

psusi to przybija.

Jeśli przeczytasz karty danych (oficjalne dokumenty), które mówią na stronie seagate.com, zobaczysz, w jaki sposób są tworzone, testowane dyski twarde i jak naprawdę działają. Nie ma idealnego dysku twardego, nigdy nie był, nigdy nie będzie (historia i fakt). W dawnych czasach musieliśmy wprowadzać uszkodzone sektory do kontrolera HDD z listy w formie papierowej, która pojawiła się w nowym polu napędu, więc kontroler je pomija.

Nowoczesne dyski mają korekcję błędów. Od pierwszego dnia sektory są złe.

Więc odwzorowują je, co oznacza, że ​​dysk pomija złe sektory. W rzeczywistości są one „logicznie zamienione” - zły sektor jest mapowany na nowy, dobry sektor zapasowych cylindrów (ma zapasowe cylindry - traktuj cylindry jak ścieżki). Wszystko to jest przezroczyste dla świata zewnętrznego - z wyjątkiem SMART.

Każdy producent może zrobić, co zechce, więc niektórzy ustawiają liczbę błędów na zero, nawet jeśli zaraz po wyprodukowaniu dysku może pojawić się 10 uszkodzonych sektorów.

W oprogramowaniu napędu znajduje się reguła 3-krotna - odczytuje sektor 3 razy, a jeśli wszystkie 3-krotnie jest źle, może wykonać „ponowną kalibrację” w locie i przeczytać jeszcze 3 razy. Jeśli dysk nadal nie działa prawidłowo, mapuje ten sektor do jednego z wolnych sektorów. Jest to głęboko w oprogramowaniu układowym, ale dzieje się to stale w tle, wszystko przezroczyste dla użytkownika.

Niezależnie od tego, czy producent zgłasza nieprzetworzone błędy za każdym razem, gdy wystąpią 3 złe odczyty, lub po zakończeniu kalibracji. Tak jak mówi powyżej, nie jest to ważne, chyba że masz wiele dysków tego samego rodzaju i nie widzisz dziwnych trendów.

Punkt 2: wszystkie dyski twarde mają naturalne błędy odczytu, możesz się tego dowiedzieć w Seagate, jeśli chcesz. ale wszystkie mają błędy w locie. i są czytane ponownie, i zwykle przechodzą test na błędy CRC. jeśli nie, NAPĘD próbuje go zamienić. jeśli uruchomisz dysk chłodny, będzie trwał długo i wielu nigdy nie zabraknie zapasowych cylindrów. ale spójrz na to, jak mówi psusi!

Piszę to na starym komputerze z jednym z pierwszych dysków twardych 1 GB, jaki kiedykolwiek powstał. i nadal jest dobry. (mam kopię zapasową) (nigdy nie brak chłodzenia ...) ciepło jest zabójcą nr 1 i skokami napięcia, uruchamiam UPS. na zdrowie i dobry dzień. Mam nadzieję, że to pomoże. (widziałeś kiedyś awarię twardego dysku DatA General? i wypełniłeś pomieszczenie ogromną ilością wełny aluminiowej, kędzierzawych sygnałów? dużo zabawy wtedy ... nigdy nudna chwila ...

jtgh
źródło