Mam urządzenie NAS, które ma nieco ponad miesiąc. Jest skonfigurowany do wysyłania mi e-mailem alertów generowanych z danych SMART dysków twardych. Po jednym dniu jeden z dysków twardych zgłosił, że sektor uległ awarii i został ponownie przydzielony. W pierwszym tygodniu liczba ta wzrosła do sześciu sektorów dla danego dysku twardego. Po miesiącu liczba ta wynosi dziewięć przeniesionych sektorów. Tempo zdecydowanie wydaje się zwalniać.
NAS jest skonfigurowany z sześcioma dyskami 1,5 TB w konfiguracji RAID-5. W przypadku dysków o tak dużej pojemności oczekiwałbym od czasu do czasu awarii jednego z sektorów, więc nie przejmowałem się przeniesieniem pierwszych kilku sektorów. Niepokoi mnie jednak to, że żaden z pozostałych dysków nie zgłasza żadnych problemów.
Przy jakim tempie relokacji lub całkowitej liczbie relokacji powinienem zacząć martwić się o zdrowie dysku? Czy może się to różnić w zależności od pojemności dysku?
źródło
Odpowiedzi:
Napędy, podobnie jak większość komponentów, charakteryzują się współczynnikiem awaryjności krzywej wanny. Na początku dużo zawodzą, mają stosunkowo niski wskaźnik awaryjności w środku, a następnie bardzo zawodzą, gdy zbliżają się do końca życia.
Tak jak cały dysk podąża za tą krzywą, tak poszczególne obszary dysku również podążają za tą krzywą. Na początku korzystania z dysku zobaczysz wiele alokacji sektorowych, ale to powinno się zmniejszyć. Gdy dysk zacznie się psuć pod koniec życia, zacznie tracić coraz więcej sektorów.
Nie musisz martwić się o 6 (w zależności od napędu - skonsultuj się z producentem), ale musisz obserwować i zobaczyć częstotliwość każdej nowej realokacji. Jeśli pogorszenie przyspieszy lub pozostanie takie samo, martw się. W przeciwnym razie powinno być dobrze po początkowym okresie docierania.
-Adam
źródło
Ponownie czytając artykuł Google na temat „ Tendencje niepowodzenia w populacji dużych dysków ”, myślę, że mogę spokojnie powiedzieć, że odpowiedź Adama jest nieprawidłowa. W analizie wyjątkowo dużej populacji napędów około 9% miało niezerowe liczby realokacji. Znamienny cytat jest następujący:
Jest to jeszcze bardziej interesujące, gdy mamy do czynienia z „realokacjami offline”, które są realokacjami odkrytymi podczas szorowania dysku w tle, a nie podczas rzeczywistych żądanych operacji IO. Ich wniosek:
Odtąd moją zasadą będzie, że dyski z niezerową liczbą realokacji mają być planowane do wymiany.
źródło
Różne dyski mają prawdopodobnie różne parametry. Na dysku, który ostatnio sprawdziłem, który był dyskiem 1 TB serii przedsiębiorstw od jednego dostawcy, zarezerwowano 2048 sektorów do realokacji.
Liczbę zarezerwowanych sektorów można oszacować w raporcie SMART na dysku, który ma niezerową liczbę przeniesionych sektorów. Rozważ poniżej raport dotyczący awarii dysku.
W tym przypadku wykorzystano 95% zarezerwowanej pojemności, czyli 1955 sektorów. Dlatego początkowa pojemność wynosiła około 2057. W rzeczywistości jest to 2048, różnica wynika z błędu zaokrąglania.
SMART zamienia dysk w stan awarii, gdy liczba realokowanych sektorów osiągnie określony próg. Dla danego napędu próg ten wynosi 64% zarezerwowanej pojemności. To około 1310 odwzorowanych sektorów.
Jednak zarezerwowane sektory nie leżą w ciągłym zakresie. Zamiast tego są one podzielone na kilka grup, każda grupa służy do mapowania sektorów z określonej części dysku. Ma to na celu utrzymanie danych lokalnych w obszarze na dysku.
Minusem lokalizacji jest to, że dysk może mieć wiele zarezerwowanych sektorów. Jednak w jednym obszarze może już zabraknąć zarezerwowanej pojemności. W takim przypadku zachowanie zależy od oprogramowania wewnętrznego. Na jednym dysku zaobserwowaliśmy, że przechodzi on w stan AWARIA i blokuje się, gdy wystąpi błąd w części, która nie jest już chroniona.
źródło
Możesz chcieć przeprowadzić długi autotest SMART, jeśli napęd go obsługuje. Może to dać więcej informacji o stanie dysku. Jeśli Twój NAS nie może tego zrobić i jeśli możesz wyciągnąć dysk lub wyłączyć NAS na kilka godzin, możesz przeprowadzić długi autotest z dyskiem twardym podłączonym do innego komputera.
źródło
Gdy nowy dysk zachowuje się w ten sposób, nie można mu wcale ufać!
Odeślij go jak najszybciej, a otrzymasz dysk zastępczy.
źródło
Różni producenci mają różne „dopuszczalne straty” (taki sam pomysł jak w przypadku monitorów i złych pikseli). Skontaktuj się z producentem napędu, aby dowiedzieć się, jaki jest jego standard.
Wygląda jednak na zły trend ...
źródło
Western Digital szczególnie dumny z technologii, która odzyskuje uszkodzony sektor w odpowiednim czasie zamiast zamrozić dysk umieszczony w RAID, jego nazwa TLER ( http://en.wikipedia.org/wiki/Time-Limited_Error_Recovery ). Czas wynosi zwykle 5..7 sekund.
Jak znalazłem w Internecie, istnieją dyski WD z wyłączoną opcją, ale niektóre osoby włączyły tę funkcję na tanich zielonych dyskach WD, a następnie umieściły je w macierzy RAID.
Narzędzie WDTLER zostało usunięte z witryny pomocy technicznej WD, ale można je łatwo znaleźć za pośrednictwem Google.
PS Używam tego narzędzia tylko do odczytu statusu i do tej pory nie używam RAID :)
źródło