Czy SMART jest inteligentny?

16

Kilka lat temu kazano mi unikać SMART jak zarazy. Powodem było to, że obciążenie, jakie testy powodują na dysku, spowoduje jego awarię.

Czy nadal tak jest? Jeśli nie, jaka jest rozsądna częstotliwość uruchamiania testów? Jeśli nadal powinienem tego unikać, jaki jest lepszy sposób monitorowania stanu moich dysków twardych?

Kok
źródło

Odpowiedzi:

30

Chociaż SMART z pewnością nie przewiduje wszystkich awarii, pracowałem przez kilka lat w warsztacie komputerowym i wiele razy komunikat o błędzie SMART był pierwszym sygnałem, że wystąpiła awaria, pozwalając mi zapisać dane klienta przed napędem zmarły.

Sama technologia nie obciąża dysku, śledzi tylko szereg wskaźników (pełna lista tutaj: http://en.wikipedia.org/wiki/SMART .), Które mogą potencjalnie prowadzić do awarii dysku, takich jak:

  • Czytaj Współczynnik błędów
  • Liczba realokowanych sektorów
  • Spin Retry Count
  • Niepoprawna liczba sektorów
  • Power on Hours

Wydajność w SMART jest znikoma, nie obciąża dysków (monitorowanie jest pasywne) i może potencjalnie ostrzec, że masz zamiar stracić wszystkie zdjęcia swoich dzieci (lub kolekcji MP3 lub cokolwiek ważnego na dysku twardym) ).

Krótko mówiąc, zostaw to włączone.

Sean Earp
źródło
Myślę, że oryginalny plakat został poinformowany o niebezpieczeństwie testów aktywnych powierzchni, które mogą być wykonane przez SMART (ręczne „długie” testy ręcznie). Bus, jak mówisz, domyślnie SMART jest pasywny i powinien być zawsze włączony. Osobiście uruchamiam również aktywne testy raz w miesiącu na moich dyskach.
Colas Nahaboo
3

Oprócz pasywnego rejestrowania liczników wydajności i zdarzeń, SMART zapewnia interfejs do inicjowania kilku rodzajów autotestów wykonywanych przez napęd i uzyskiwania ich wyników później.

Niektóre z tych testów polegają na skanowaniu całej powierzchni talerza podczas pozostawania w trybie online i odpowiadania na żądania hosta, więc ciężkie operacje we / wy powodują dużo omłotu.

Wydaje mi się, że to ostatnie jest źródłem poważnego nieporozumienia, o którym ci mówiono. SMART jest fajny.

NekojiruSou
źródło
-6

Jakiś czas temu Google przeprowadził badanie (PDF) „ Trendy awarii w populacji dużych dysków ”. Mają mnóstwo używanych dysków, a badanie wykazało:

W naszej analizie zidentyfikowano kilka parametrów z funkcji samokontroli napędu (SMART), które ściśle korelują z awariami. Pomimo tej wysokiej korelacji dochodzimy do wniosku, że modele oparte na samych parametrach SMART raczej nie będą przydatne do przewidywania awarii poszczególnych napędów. Nieoczekiwanie stwierdziliśmy, że temperatura i poziomy aktywności były znacznie mniej skorelowane z awariami napędu niż wcześniej zgłaszano.

Temperatura jest więc znacznie większym czynnikiem niż obciążenie napędu. Plus z całą korektą błędów, która występuje przez cały czas w tych nowych dyskach, dodaje się o wiele więcej stresu, nad którym nie masz kontroli. Jeśli szukasz narzędzia do konserwacji (lub odzyskiwania) dysków, polecam SpinRite . Jest to Steve Gibson i jego niesamowity produkt.

Bernie Perez
źródło
3
Czy twoje referencje nie mówią, że temperatura nie jest skorelowana z awarią napędu? ... ale uważasz to za „znacznie większy czynnik”? Wyjaśnij, co masz na myśli
Michael Haren
Czy to źle czytam? Mówi, że temperatura nie jest silnie skorelowana z awarią napędu, prawda? Zgodnie z tym artykułem nie ma też aktywności.
MrChrister
1
„Temperatura jest więc znacznie większym czynnikiem niż obciążenie napędu”. - Skąd to wywnioskujesz? Cytowany przez ciebie akapit mówi, że temperatura nie była tak skorelowana.
Joe Phillips
3
-1 za to, że nie tylko nie przeczytał poprawnie streszczenia artykułu, ale też nie poświęcił czasu na przeczytanie całości. Awaria napędu jest zasadniczo spowodowana albo wadą produkcyjną (jak pokazano na ryc. 3: wysokie zużycie w pierwszych 3 miesiącach eliminuje błędy komponentów - po tym awarii z powodu użytkowania zaczyna się zbiegać), albo degradacją w miarę upływu czasu. Degradacja w czasie jest tym, co wykryje SMART. Ryc. 5 pokazuje, że temperatura wcale nie jest dużym czynnikiem - w rzeczywistości raport sugeruje, że dyski chłodzące mają większą zmianę awarii niż te pracujące na gorąco, z pewnością w ciągu pierwszych 3 lat.
Ian