Jak zresetować wyniki SMART

16

Jak mogę zresetować wyniki SMART, aby nie rejestrowały poprzednich wyników. Moim powodem jest to, że testowałem dyski twarde zamknięte razem na zamkniętej obudowie. Spowodowało to, że jeden z dysków twardych nie odczytał temperatury przepływu powietrza.

Po otwarciu obudowy (co obniżyło temperaturę wszystkich dysków o 10 stopni Celsjusza w ciągu 5 minut), a następnie oddzieleniu dysków nieco więcej (3 mniej stopni) Wszystkie wyniki były dobre, ale ponieważ odczyt przepływu powietrza nie powiódł się w poprzednim czytaniu, zawsze pokazuje się jako nieudany.

Jak mogę zresetować odczyty dla SMART?

wprowadź opis zdjęcia tutaj

Luis Alvarado
źródło
1
Myślę, że możesz użyć Mhdd do wyłączenia smarta. To z narzędziami dyskietek na sysresccd.org/System-tools nie jest najlepszym pomysłem ... ale może warto się przyjrzeć.
Mateo
2
Dlaczego chcesz to zresetować?
Angelo
Cóż, to było w zasadzie 3 lata temu, ale sądzę, że było tak, ponieważ w tym momencie HDD znajdował się w miejscu, które miało DUŻO zewnętrznego ciepła. Po przeniesieniu go do pomieszczenia o bardziej zimnym klimacie problem nadal występował, chociaż temperatura wzrosła z 68 stopni do 37 stopni. Tak więc problemem był wzrost temperatury zewnętrznej, który stworzył problem na początku, ale nadal pojawiał się po przeniesieniu go w inne miejsce.
Luis Alvarado,

Odpowiedzi:

0

Dyski twarde mają wolne miejsce na potrzeby odzyskiwania. Odzyskiwanie odbywa się automatycznie. Narzędzia do odzyskiwania mapują tylko fizycznie uszkodzone sektory na to wolne miejsce. Po ponownym mapowaniu, gdy odczyt lub zapis następuje w uszkodzonym sektorze, dysk zmienia dostęp do wolnego miejsca i ukrywa błąd.

Szczerze mówiąc, nie znam sposobu na zresetowanie danych SMART. Jest to coś, co dysk twardy utrzymuje wewnętrznie, aw każdym razie byłoby to złe.

SMART zgłasza awarię dysku twardego! Zresetowanie liczników nie zmieni faktu, że próg błędu dla dysku został przekroczony.

Więc NIE, nie możesz zresetować historii SMART. Jest instalowany fabrycznie w celu oceny dysku w przypadku awarii. SMART można tylko wyłączyć lub włączyć.

Mam nadzieję, że to odpowiada na twoje pytanie.

Mitch
źródło
Cześć Mitch, jak wyjaśniono w pytaniu, niepowodzenie nie jest prawdziwe. Stało się tak, ponieważ wszystkie dyski twarde zostały zamknięte bardzo blisko siebie na słabo wentylowanej przestrzeni. Po zmianie i ponownym testowaniu działał doskonale, tyle że wciąż wspominał o niepowodzeniu z przeszłości. W tej chwili zrobiłem następujące sudo smartctl -l sataphy, reset / dev / sdd, które rozwiązały problem ogólnej oceny biorąc pod uwagę poprzednie niepowodzenie, które teraz wydaje się normalne, ale błąd nadal pojawia się dla konkretnego atrybutu. Znowu HDD nie ulega awarii, ale poprzedni błąd nadal się wyświetla.
Luis Alvarado
Rozumiem, ale może wydawać się normalny, tylko ukryty. Zapytałeś, czy można to zresetować, a odpowiedź brzmi NIE. Nawet jeśli udało Ci się ukryć błąd, gdy dysk trafi do producenta z dowolnego powodu, może dowiedzieć się, co faktycznie z nim poszło. Wszystko, co mówię, wciąż pokazuje poprzedni błąd i dopóki nie zdobędziesz narzędzi używanych przez producentów, aby przywrócić status SMART dysku, nadal będzie się wyświetlał.
Mitch
26

W rzeczywistości istnieje sposób na zresetowanie danych SMART. Potrzebujesz tylko prostego konwertera RS232 na USB (UART na TTL) i kilku kabli podłączonych do interfejsów diagnostycznych HDD. (znajduje się po prawej stronie portu sata, 5 lub 4 piny) Musisz podłączyć kable RX TX i GND (i oczywiście kabel zasilający: D), a następnie włączyć dysk twardy i połączyć się z nim za pomocą szpachli lub hiperterminalu (linux może się z nim połączyć własny terminal, jak sądzę) na przykład dla napędów Seagate: dla 7200.10 i starszych szybkość transmisji wynosi 9600 dla 7200.11, a nowsze to 38400

polecenia po połączeniu naciśnij CTRL + Z, a następnie wpisz „/ 1” naciśnij Enter wpisz „N1” naciśnij Enter po zakończeniu odłącz wszystkie kable i włącz dysk twardy jak zwykle, aby zobaczyć zmiany :)

dla innych informacji o dysku twardym użyj google :)

MRX
źródło
5
Wydaje się, że dotyczy to tylko dysków Seagate, ale masz rację, ten film wyjaśnia ten proces.
Adrian Frühwirth
5
Jeden z moich współpracowników skontaktował się z Seagate i powiedzieli nam, że od tego czasu zablokowali tę funkcję, aby nie można było uzyskać do niej dostępu bez zastrzeżonego narzędzia. Nie jestem pewien, w którym momencie to zrobili.
JFA,
4

Dane SMART nie są bardzo standardowe między producentami, ale test temperatury dysku twardego powinien wskazywać, czy temperatura dysku przekroczyła w przeszłości próg: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

Myślenie jest takie, że przegrzanie zwiększa twoje szanse na porażkę. SMART nie twierdzi, że twój dysk jest zły, ale ma większą szansę na awarię w przyszłości.

SMART ma być audytem historii napędów i jest utrzymywany przez sam napęd, więc nie można „zresetować” ani „wyczyścić” wartości SMART.

Nieznacznie Kuban
źródło
3

Istotą aktualnych / najgorszych atrybutów, takich jak temperatura, jest dokładnie to: powiedzieć, czy napęd kiedykolwiek przekroczył swoją maksymalną temperaturę roboczą, a zatem mógł doznać trwałego uszkodzenia.

Dlatego mówi „nie powiodło się w przeszłości”, a nie „teraz zawodzi”: ledwo dotknąłeś progu maksymalnej temperatury. Uwaga: wyświetlanie atrybutów pokazuje „znormalizowany: 50, próg: 45, najgorszy: 45”. (Są to znormalizowane wartości 0..200 jak dla każdego innego atrybutu, a nie surowe temperatury Celsjusza.)

Masz też kilka wadliwych sektorów (nieusuwalne błędy sektorowe), więc niezależnie od tego, czy przyczyną była krótka wysoka temperatura, czy nie, prawdopodobnie czas porzucić ten dysk.

Lepszy interfejs użytkownika oprogramowania SMART pokazałby aktualną i maksymalną temperaturę . np.
smartctl -a /dev/sdalubsmartctl -x /dev/sda ( -xdrukuje wszystkie dostępne dane SMART i inne niż SMART, które można uzyskać z dysku, w tym dziennik historii temperatury, jeśli dysk go posiada, z wykresem słupkowym ASCII.)

smartctl -x obejmuje to dla starego dysku twardego WD Green 1 TB (WD10EADS):

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Oprogramowanie, którego używasz, wygląda tak, jakby wyświetlało tylko bieżącą temperaturę, która jest nieco poniżej progu, ale nie ukryje faktu, że dysk był w przeszłości niezgodny ze specyfikacją.


Z pewnością możesz usprawiedliwić zignorowanie tej chwilowej wysokiej temperatury, jeśli naprawdę naprawiłeś to w kilka minut. Ale nigdy nie będziesz (lub nie powinieneś) zmuszać samego dysku do kłamstwa na temat tego, że przez pewien czas przekraczał on maksymalną temperaturę znamionową, a zatem atrybut nie był w przeszłości.

Możesz skonfigurować smartdignorowanie dowolnego atrybutu, aby nadal otrzymywać przydatne powiadomienia, jeśli cokolwiek innego przekroczy próg na terytorium oficjalnie uszkodzonym. : smartd.conf(5)mówi:

-i ID [ATA only]Ignoruj ​​identyfikator numeru atrybutu urządzenia podczas sprawdzania niepowodzenia atrybutów użycia. Identyfikator musi być liczbą całkowitą dziesiętną w zakresie od 1 do 255. Niniejsza dyrektywa modyfikuje zachowanie dyrektywy „-f” i bez niej nie ma żadnego efektu.

Jest to przydatne, na przykład, jeśli masz bardzo stary dysk i nie chcesz ciągle otrzymywać wiadomości o niepowodzeniu atrybutu godzin pracy (zwykle atrybut 9). Niniejsza dyrektywa może pojawić się wiele razy dla jednego urządzenia, jeśli chcesz zignorować wiele atrybutów.


Rozszerzone atrybuty historii temperatury

Właśnie dostałem nowy 6 TB Seagate Barracuda (oprogramowanie układowe ST6000DM003-2CY186 0001, dysk 5425 RPM), który ma kilka interesujących statystyk, w tym czas spędzony przekraczający min / maks punkty operacyjne oraz wysokie / niskie krótkoterminowe i log-temps .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

I w sekcji ze szczegółami:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(Dysk został włączony tylko przez kilka minut; prawdopodobnie dlatego -w niektórych polach nie ma danych).

Jeśli dysk ma te rozszerzone atrybuty, możesz pokazać komuś, że czas spędzony poza dozwoloną temperaturą był bardzo krótki (w takim przypadku). Prawdopodobnie, jeśli zamierzasz zmodyfikować dane SMART, po prostu to zrobiłeś i usunąłeś wzmiankę o tym, że kiedykolwiek był poza zasięgiem, ale oczywiście nie możesz w 100% ufać żadnym danym z dysku drugiej ręki, który ktoś próbuje cię sprzedać.

Zobacz /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist się więcej o stosowanych napędów z Na przykład „cofnięcie licznika przebiegu” w atrybucie „Power_On_Hours”.

Peter Cordes
źródło
Dziękuję Peter za dokładną analizę tutaj. Mile widziane.
Luis Alvarado,
0

Według mojej wiedzy, jedynym sposobem, aby to zatrzymać, jest wyłączenie SMART w BIOS-ie. To jednak tylko zatrzyma SPRZĘT.

Twój system operacyjny nadal wysyła zapytanie do dysku o informacje SMART i informuje, że nie działa.

Jesseryte
źródło