Mam dysk w dwupłytowym oprogramowaniu RAID-1, dla którego ostatnio pojawił się „nieaktywny sektor nie do naprawienia” w stanie SMART.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
Widocznie jest to tylko oznaka nieuchronnej awarii dysku, jeśli występuje coraz częściej (a ponieważ dysk jest dublowany, nie ma również dużego ryzyka rzeczywistej utraty danych). W tym momencie autotest również w pewnym momencie nie powiódł się i smartd
wysłał mi wiadomość e-mail z powiadomieniem o tym, jak to powinno zrobić.
Jednak pisanie do uszkodzonego sektora zwykle powoduje, że dysk używa jednego ze swoich wolnych sektorów zamiast tego, co najwyraźniej zrobił, ponieważ odkąd dd
przeszukałem dysk, wszystkie autotesty przebiegły dobrze. A badblocks
także nie znalazł powodu do narzekań.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
Liczba wadliwych sektorów nie zmniejszyła się, ale tak naprawdę nie powinna, ponieważ uszkodzony sektor wciąż tam jest, choć nie jest używany. Jednak smartd
nadal wysyła mi e-maile każdej nocy:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Jest to oczywiście bardzo denerwujące i znieczula mój zdrowy odruch paniki na smartd
maile.
Dysk to Western Digital WD20EARS, a smartd
wersja to 5.41 2011-06-09 r3365.
źródło
-U 198+
powinien to zrobić. Niezłe znalezisko!istnieją dwie możliwości, skąd pochodzą te maile. smartd jest w stanie wysyłać maile sam, ale najprawdopodobniej nie jest skonfigurowany w ten sposób, więc zakładam, że te maile są wysyłane za pomocą logcheck. Jeśli to założenie jest błędne, nie musisz czytać dalej.
Logcheck skanuje pliki dziennika i wysyła wiadomości e-mail, jeśli sądzi, że powinieneś się martwić o cokolwiek, co się stało z / w twoim systemie.
Możesz napisać regułę ignorowania logcheck, która mówi logcheck, aby nie wysyłał wiadomości pasujących do określonego wzorca.
Możesz (w systemach opartych na Debianie) utworzyć plik o nazwie „/etc/logcheck/ignore.d.server/smartd_own” o następującej treści:
Powinno to odfiltrować irytujące wiadomości e-mail, ale napiszę ponownie, jeśli wzrośnie licznik sektorów, których nie można naprawić.
źródło
smartd
niestety wysyła wiadomości bezpośrednio. Najwyraźniej jednak zawsze można to zmienić. Rozważę to, jeśli nie będzie innego wyjścia, więc dziękuję!