Czy mogę ufać tej wartości w danych SMART?

2

Przeskanowałem dysk twardy za pomocą HD Tune i otrzymuję następujące dane:

HD Tune: ST9120817AS Zdrowie

ID Bieżący najgorszy status danych progowych   
(01) Wskaźnik błędu odczytu surowego 100 253 6 0 Ok       
(03) Czas rozpędzania 100 99 85 0 Ok       
(04) Start / Stop Count 1 1 20 579275 Failed   
(05) Realocated Sector Count 100 100 36 0 Ok       
(07) Szukany poziom błędu 83 60 30 201641351 Ok       
(09) Godziny włączenia liczą 90 90 0 9064 Ok       
(0A) Spin Retry Count 100 100 34 0 Ok       
(0C) Licznik cykli mocy 96 96 20 4456 Ok       
(BB) (nieznany atrybut) 100 100 0 0 Ok       
(BD) (nieznany atrybut) 98 98 0 2 Ok       
(BE) Temperatura przepływu powietrza 56 39 45 1023606828 Ok       
(BF) Współczynnik błędu G-sense 100 100 0 43 Ok       
(C0) Power Retract Count 100 100 0 41 Ok       
(C1) Liczba cykli ładowania 1 1 0 576186 Ok       
(C2) Temperatura 44 61 0 44 Ok       
(C3) Odzyskano sprzęt ECC 64 59 0 148606121 Ok       
(C4) Realocated Event Count 93 93 0 6385 Ok       
(C5) Aktualny sektor oczekujący 100 100 0 0 Ok       
(C6) Offline Niepoprawne 100 100 0 0 Ok       
(C7) Błąd Ultra DMA CRC Liczba 200 200 0 0 Ok       
(C8) Wskaźnik błędu zapisu 100 253 0 0 Ok       
(CA) Zwiększono licznik TA 100 253 0 0 Ok       
(F0) Godziny lotów głową 0 0 0 0 Ok       
(F1) (nieznany atrybut) 0 0 0 1419893233 Ok       
(F2) (nieznany atrybut) 0 0 0 239964343 Ok       

Czas włączenia: 9064
Stan zdrowia: Niepowodzenie

Szczególnie martwię się o liczbę start / stop. Co oznacza Datawartość? Czy to rzeczywista liczba uruchomień dysku? Byłoby to bardzo wysokie, ponieważ mój drugi dysk, tak samo stary, ma tylko 1433. Jest tak wysoka, że ​​zastanawiam się, czy mogę w ogóle zaufać tym wartościom, zwłaszcza że wszystko wydaje się działać dobrze. Jak prawdopodobne jest, że otrzymuję fałszywe odczyty?

Jak mam się bać utraty wszystkich moich danych?

Renaat De Muynck
źródło
Czy to na tak zwanym zielonym dysku? Te są często skonfigurowane do samodzielnego wyłączania się po bardzo krótkim czasie w celu uzyskania bezpiecznej energii. Ma to sens w niektórych konfiguracjach (np. Na zewnętrznym dysku zawierającym filmy), ale powoduje spustoszenie, gdy jest używany na dyskach zawierających pliki dziennika.
Hennes

Odpowiedzi:

4

Zawsze powinieneś mieć kopię zapasową wszystkich danych. To powiedziawszy, SMART nie jest tak niezawodny jak wskaźnik nieprawidłowego działania napędu, więc nie martw się zbytnio .

soandos
źródło
@suandos Dysk jest używany tylko dla maszyn wirtualnych, dane znajdują się w repozytoriach internetowych. Ponowne instalowanie oprogramowania jest jednak uciążliwe. PS: Nadal się martwię :)
Renaat De Muynck,
2

Tak, wartość start / stop powinna pokazywać liczbę uruchomień / zatrzymań silnika wrzeciona i jest zwykle wartością wiarygodną. Oznaczałoby to, że silnik zatrzymywał się / uruchamiał co minutę. Być może użyłeś niewłaściwego niskiego limitu czasu dla przejścia napędu w tryb gotowości lub naprawdę agresywnego ustawienia APM. Jeśli możesz uruchomić system Linux, wyjście hdparm -B /dev/sda(zakładając, że twój dysk twardy to sda) byłoby interesujące. Możesz także użyć lepszego narzędzia, takiego jak smartmontools, aby sprawdzić wartości SMART, ponieważ twoje narzędzie nie rozpoznaje / nie dekoduje niektórych atrybutów z nieznanych przyczyn.smartctl -a /dev/sdabyłoby poleceniem do uruchomienia. Ale ponieważ nie ma znanych błędów oprogramowania układowego na dysku, które mogłyby dawać błędne wyniki bez obejść, znane już dane prawdopodobnie będą takie same. smartctl -a ma jednak więcej danych wyjściowych, więc mogą pojawić się dodatkowe interesujące dane.

Interesująca jest również wartość Realocated Event Count. Mówi, że twój napęd próbował przydzielić uszkodzone sektory 6385 razy, ale wygląda na to, że zawiódł za każdym razem, ponieważ Reallocated Sector Count wciąż wynosi 0. Martwiłbym się tym. Zalecam jak najszybsze wykonanie kopii zapasowej, wykonanie długiego testu na dysku za pomocą, smartctl -t long /dev/sdaa następnie powtórzenie smartctl -a /dev/sdapo zadanym czasie odpytywania. Jeśli wynik testu zostanie zaliczony, być może będziesz mógł nadal korzystać z dysku, ale powinieneś być przygotowany na większe ryzyko awarii.

Jeśli wolisz Windows / GUI, możesz użyć GSmartControl zamiast smartmontools do przeglądania danych / wykonania testu.

Gurken Papst
źródło
Dzięki za jasne wyjaśnienie, dało mi to pewien wgląd. Korzystam z systemu Windows 7, więc wypróbuję GSmartControl. Zrobiłem już rozszerzone skanowanie błędów z HD Tune bez błędów. Nie wiem, czy jest to powiązane, ale mniej więcej raz w tygodniu mój system zawiesza się, a dioda dysku twardego świeci. Muszę ręcznie wyłączyć laptopa (myślę, że może to być luźny kabel, ale tak naprawdę tutaj zgaduję). Czy mogło to spowodować wysoką liczbę start / stop? Czy awaria / brak połączenia HD może zawiesić mój system operacyjny, jeśli jest on na innym dysku?
Renaat De Muynck
Twoje zamrożenia są prawdopodobnie związane z dyskiem, jeśli dioda LED świeci się zawsze, gdy się zawiesza. Czy próbowałeś poczekać jakiś czas, jeśli tak się stanie? Może to trwać po kilku minutach. Powinieneś również sprawdzić swój dziennik błędów SMART za pomocą GSmartControl / smartctl. Luźny kabel jest mało prawdopodobny, ponieważ nie ma go w normalnych laptopach. Nadal możesz chcieć ponownie osadzić dysk, aby upewnić się, że jest dobrze podłączony. Jeśli nie miałeś poważnego problemu z odczytem / zapisem na dysk, wysoka liczba start / stop prawdopodobnie nie jest spowodowana złym połączeniem. Raczej podejrzewam bardzo agresywne ustawienie APM.
Gurken Papst
Sprawdź to (jak już zalecane) z hdparm. Możesz do tego użyć systemu Linux na żywo. Odczytywanie / zapisywanie na uszkodzony dysk może zablokować cały system na kilka minut, aż do przekroczenia limitu czasu. Tak, może się tak zdarzyć, jeśli Twój system operacyjny nie znajduje się na tym dysku. Całkowicie odłączony dysk oczywiście nie spowoduje zawieszenia, ale nie widzę, jak to może być związane z twoim problemem.
Gurken Papst