Chcę zbudować serwer pamięci i kupić 10 x 2TB WD RED's
. HDD's
Właśnie przybył.
Czy jest jakieś narzędzie, którego używacie do sprawdzania uszkodzonych dysków lub do najlepszej obrony przed śmiertelnością niemowląt przed skopiowaniem prawdziwych danych na dyski?
Czy lepiej jest sprawdzić każdy z nich HDD
lub przetestować tablicę ( ZFS raid-z2
) poprzez skopiowanie na nią dużej ilości danych?
Odpowiedzi:
Miałem to samo pytanie 2 miesiące temu. Po wysłaniu uszkodzonego dysku, dysk zastępczy zawiódł na moim NAS po 3 dniach. Postanowiłem więc przetestować nowy zamiennik przed wprowadzeniem go do produkcji. Nie testuję każdego nowego dysku, który kupuję, tylko na „odnowionych” dyskach, którym nie do końca ufam.
Jeśli zdecydujesz, że chcesz przetestować te dyski, zaleciłbym przeprowadzenie skanowania badblocks i rozszerzonego testu SMART na zupełnie nowym dysku twardym.
Na dysku o pojemności 2 TB zajmuje to do 48 godzin. Polecenie badblock zapisuje dysk ze wzorem, a następnie odczytuje bloki ponownie, aby sprawdzić, czy wzór rzeczywiście tam jest, i powtarza to z 4 różnymi wzorami.
To polecenie prawdopodobnie nie pokaże żadnych złych bloków na nowym dysku, ponieważ dyski obecnie realokują złe bloki.
Dlatego przed i po tym przeprowadziłem inteligentny test i sprawdziłem liczbę przeniesionych i bieżących oczekujących sektorów. Jeśli któryś z nich poszedł w górę, twój dysk ma już pewne złe bloki i może okazać się niewiarygodny.
Następnie ponownie uruchamiam rozszerzony test SMART.
Możesz najpierw zainstalować smartctl lub smartmontools.
Ostrzeżenie: flaga badblocks -w zastąpi wszystkie dane na dysku, jeśli chcesz tylko sprawdzić odczyt, nie zastępując dysku, użyj
badblocks -vs /dev/sdX
Jeśli po tym twoje inteligentne wartości wydają się ok, zaufałbym dyskowi.
Aby dowiedzieć się, co oznacza każda inteligentna wartość, możesz zacząć szukać tutaj
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
źródło
To są nowe dyski. Albo upadną, albo nie. Już teraz masz duży krok do przodu, korzystając z systemu plików ZFS, który zapewni doskonały wgląd w stan najazdu i kondycję systemu plików ...
Nie zrobiłbym nic poza budowaniem tablicy. To jest cel redundancji. W przypadku innych wymienionych metod nie będziesz w stanie spowodować awarii dysku.
źródło
Możesz użyć Bonnie ++ do testowania. Może doskonale emulować wzorzec zachowania serwera plików.
Na przykład:
Test zostanie uruchomiony jako użytkownik „nobody” i utworzy / przepisze / usunie 100 * 1024 plików, od 200 do 150000 bajtów na plik, w 100 automatycznie utworzonych katalogach poniżej / home / tmp. A liczba testów = 300. Możesz grać wokół liczby / rozmiaru pliku i liczby powtórzeń testu.
źródło
Zwykle po prostu wykonuję pełną inicjalizację RAID i tam, gdzie ma to zastosowanie, zaczynam zapełniać system plików w tym czasie, cały czas wiedząc, że może być problem z powodu martwych dysków. W ten sposób nie tracę czasu na testy, które i tak są dość niewiarygodne, i natychmiast łapałbym prawdziwe słabe dyski. Po tym może nadal istnieć podwyższona szansa na awarie napędu z powodu „śmiertelności niemowląt”, ale nie ma praktycznego sposobu na wyeliminowanie tego.
W praktyce żaden z ostatnich kilkuset dysków, których użyłem w macierzy RAID, nie miał problemów podczas pierwszego roku działania.
źródło
Pracuję dla firmy, która codziennie przeprowadza takie testy. I tak, testujemy każdy kupiony dysk twardy. Nasz proces rozpoczyna się od uruchomienia dysków za pomocą bezpłatnego programu opartego na systemie DOS o nazwie HDAT2. Jest do ściągnięcia za darmo. Może uzyskać dostęp do SMART i niektórych innych funkcji napędu, które są niedostępne w środowisku Windows. W zależności od wyników przeprowadzimy je przez jedną z kilku różnych linii specjalistycznego sprzętu, ale u ich podstaw przeważnie po prostu uruchamiają krótki autotest SMART, długi test, bezpieczne kasowanie i All Read w celu weryfikacji sektorów. Moją propozycją byłoby uruchomienie bezpiecznego wymazania całego dysku, a następnie uruchomienie pełnego odczytu, a następnie krótkiego autotestu SMART. Ta kolejność jest ważna, ponieważ krótki autotest może nie znaleźć niczego, jeśli zostanie uruchomiony na początku testowania, ale po pełnym zapisaniu i przeczytaniu dysku może coś podnieść. Mam nadzieję że to pomoże.
źródło
Możesz użyć pakietu testowego producenta lub czegoś takiego jak SpinRite, aby zamieść cały dysk. Dobrym pomysłem byłoby również przyjrzenie się wartościom SMART , szukaniu złych sektorów i innych oznak starości / awarii.
źródło
Jeśli naprawdę chcesz przetestować, użyj
badblocks
testu zapisu. Zapisuje wzorce danych na dysku, a następnie odczytuje je w celu sprawdzenia. Podczas tego będzie trochę stresować twój dysk. Moim zdaniem, jeśli uda się uruchomić, możesz zaufać dyskowi.Ale myślę, że wystarczy ZFS i dobra kopia zapasowa.
źródło