Raid 5 Uszkodzenie dysku twardego

10

Mam serwer IBM x3650 M4. Jest skonfigurowany z Raid 5 i zawiera 4 dyski twarde SAS o pojemności 500 GB każdy. Teraz 2 dysk twardy jest wyświetlany jako zły. Tak więc, zastępując 2 dyski twarde nowymi, dane zostaną automatycznie odbudowane, czy też muszę wprowadzić inne zmiany. Nie wiem dużo o konfiguracji RAID, więc proszę o pomoc.

lakhan vasre
źródło
3
To wydaje się apropos: serverfault.com/questions/2888/why-is-raid-not-a-backup
Andrew Henle
2
Czy tablica jest obecnie online? Czy możesz uzyskać do niego dostęp? Jakie są twoje priorytety? Czy twoja kopia zapasowa jest aktualna? Czy przestoje stanowią problem?
David Schwartz
2
Reasumując, odbudowywanie dysków twardych RAID jest bardzo stresującą operacją dla dysków HD ... Istnieje bardzo wyraźna możliwość, że inne dyski twarde zginą podczas tego procesu (wszystkie mają ten sam wiek, pochodzą z tej samej partii, jeśli mają wady, wszystkie mają tę samą wadę) ... Prawdopodobnie lepiej jest spróbować skopiować wszystkie dane gdzie indziej.
xanatos
@ xanatos Jak mogę skopiować wszystkie dane w inne miejsce. czy możesz mi powiedzieć to samo.
lakhan vasre
11
„Jak mogę skopiować wszystkie dane gdzie indziej.” To właśnie nazywamy „kopią zapasową”. Już to robisz, prawda? Czy regularnie testujesz, czy też możesz go przywrócić?
Roger Lipscombe

Odpowiedzi:

19

Jeśli stracisz więcej niż jeden dysk w macierzy RAID 5, macierz została w jakiś sposób nieodwracalnie uszkodzona. W większości przypadków dane są całkowicie zniszczone w twoim przypadku, jeśli nie jesteś ekspertem od odzyskiwania lub jeśli nie chcesz wysłać ich do zestawu do odzyskiwania. Jeśli chcesz odzyskać dane z tej tablicy, natychmiast przełącz je w tryb offline i albo odzyskaj je samodzielnie, albo wyślij tablicę + kartę do kogoś takiego jak DriveSavers.

Jest to jeden z powodów, dla których ogólnie zaleca się trzymać z dala od RAID 5 i używać RAID 6, 10 lub pewnego poziomu RAID-Z lub unRAID.

Teraz będzie świetny czas na przywrócenie z kopii zapasowej. Jeśli zamierzasz utworzyć nową tablicę z nowymi dyskami, możesz również rozważyć nadanie tym pozostałym dyskom topora, jeśli są one tak samo stare.

Bufor
źródło
10
Powiedziałbym, że „ogólnie zaleca się trzymać z dala od RAID5” jest nieprawdziwe. Jak każde narzędzie lub technologia, musisz być świadomy jej ograniczeń. Dwa awarie dysków w macierzy RAID1 lub RAID10 mogą również powodować ten sam problem.
Mark Henderson
6
Ditto @MarkHenderson. RAID 6 często ma koszt wydajności, a na pewno koszt przestrzeni dyskowej; RAID 10 ma koszt przestrzeni dyskowej; a RAID-Z1 nie jest bardziej odporny na awarie wielu dysków niż RAID 5, chyba że ZFS jest bardziej odporny niż cokolwiek innego, czego można by użyć, co może wcale nie być. Nie wiem o unRAID. Podejrzewam, że podstawowym problemem PO nie jest monitorowanie macierzy pod kątem problemów, ale (i nie chodzi o to, by trzymać się z dala od RAID 5) nie unieważnia większości tej odpowiedzi: macierz RAID 5 z dwoma martwymi dyskami nigdy nie pójdzie odzyskać na własną rękę.
CVn
1
Porada dotycząca unikania RAID5 dotyczy nowych wersji, szczególnie w przypadku bardzo dużych dysków. Głównym problemem związanym z RAID5 jest to, że w czasie przebudowy może wystąpić awaria drugiego dysku. Im dłuższy czas odbudowy, tym większa szansa na to. Starsze macierze RAID5 są zbudowane z mniejszych dysków, więc ryzyko jest mniejsze.
grill
@ MichaelKjörling, jak rozumiem, unRAID to w zasadzie RAID 5 z rozłożeniem na poziomie pliku, a nie rozłożeniem na poziomie bloku. Tak, awaria dwóch dysków oznacza utratę macierzy, ale inny wzorzec pamięci oznacza, że ​​możesz odzyskać wszystko oprócz plików znajdujących się na uszkodzonych dyskach.
Mark
To prawda, że ​​porady dotyczące RAID 5 dotyczą głównie nowych macierzy z dużymi dyskami. Jeśli OP ma awarie podwójnych dysków na dyskach, które mogą być latami, nadszedł czas, aby zdobyć nowe - a koszt nowych dysków> = 1 TB w większości przypadków jest zwykle mniej więcej taki sam jak dysku 500G. Trudno jest udzielić mniej ogólnej odpowiedzi, gdy nie wiem, jaki jest / powinien być nakład pracy.
Spooler
8

Aby to wyjaśnić, macie 4-dyskową macierz R5, wymieniacie 2 dyski jednocześnie - prawda?

czy dane zostaną odbudowane automatycznie, czy też muszę wprowadzić inne zmiany?

Jeśli to, co czytam, jest poprawne, to nie, nie, nie zostanie odbudowane, zniszczysz swoje dane i tak, będziesz musiał dokonać innych zmian, aby usunąć macierz i przywróć z ostatniej kopii zapasowej.

Jeśli źle odczytałem twoje pytanie, proszę wyjaśnij, w przeciwnym razie grałeś sam.

Siekacz 3
źródło
1
Cześć Chopper3 Jeszcze nic nie zrobiłem. Właśnie teraz mam nowy dysk twardy, ale przed podłączeniem go do serwera chciałem was zapytać. że niezależnie od tego, czy mam podłączyć dyski twarde, czy spróbować wypróbować inne opcje odzyskiwania, czy coś innego trzeba zrobić. Jestem nowy w tym, więc nie jestem pewien, co dokładnie należy zrobić
lakhan vasre
5
Ach - dobra wiadomość - w takim przypadku musisz wymienić oba dyski JEDEN RAZ, upewniając się, że macierz jest w pełni przebudowana po wymianie pierwszego dysku przed wymianą drugiego dysku. Gdy to zrobisz i tablica R5 będzie w 100% dobra, musisz stworzyć plan migracji z R5 do czegoś bardziej stabilnego, takiego jak R6 / 60 lub R10 ok.
Chopper3
3
@ Chopper3 Myślę, że RAID-5 dla macierzy 4-dyskowej niekoniecznie musi być zastąpiony RAID-6 lub RAID-10. RAID-5 powinien zapewniać odpowiednią dostępność (pomimo awarii dwóch dysków tutaj ...), a żadna wersja RAID i tak nie zapewnia odpowiedniej kopii zapasowej.
Andrew Henle,
2
Daniel i Andrew - z dyskami 4 x 500 GB, więc tak. Widzę, że z przyjemnością będziesz kontynuować R5, ale jak wiemy, korzystanie z R5 z dyskami o pojemności> 1 TB jest bardzo niebezpieczne i jest to najlepsza część dekada
Chopper3
5
@ Chopper3: Zasada ta dotyczy naiwnych implementacji RAID5 i bardzo cennych danych. Inteligentny kontroler RAID5 może odzyskać dane z 2 dysków z nieodwracalnymi błędami odczytu, jeśli się nie pokrywają. A w przypadku dysków 1 TB jest to już dość niska szansa. (Nadal masz kłopoty, gdy umiera cały dysk, plus URE na innym dysku, ale to ryzyko jest dość niezwiązane z rozmiarem)
MSalters