Jeśli macierze RAID5 / 6 są ryzykowne z powodu URE, czy zagrożone są również pełne schematy tworzenia kopii zapasowych / przywracania?

11

Jak rozumiem, masz dużą szansę napotkać URE podczas przebudowy, ponieważ musisz odczytać dużą ilość danych, aby wykonać zadanie.

Czy ten problem wpływa również na scenariusze tworzenia kopii zapasowych i przywracania dużych ilości danych? Jeśli musisz wykonać pełne przywracanie z kopii zapasowej 10 TB, URE wydają się równie prawdopodobne.

Cowlby
źródło
3
Naprawdę nie jest to problem z RAID6, a RAID nie jest przeznaczony do tworzenia kopii zapasowych, ale do dostępności.
user9517
Jedna kopia zapasowa to za mało.
Przywróć Monikę - M. Schröder

Odpowiedzi:

13

Prawdziwy problem dotyczący URE i RAID5 polega na tym, że po zaszyfrowaniu nawet jednego URE wiele kontrolerów sprzętowych po prostu przerywa rekonstrukcję RAID i deklaruje śmierć macierzy, przełączając wszystkie dane w tryb offline. Chociaż jest to „najbezpieczniejszy zakład” w odniesieniu do potencjalnego uszkodzenia danych, nie zawsze jest to najlepsza rzecz (np .: pomyśl o URE wpływającym na wolny / nieprzydzielony przez sektor plików system danych. Chociaż powinno być bezpiecznie zignorować kontroler sprzętowy przełączy całą tablicę w tryb offline).

RAID6 jest znacznie mniej podatny na URE, ponieważ redundancja dwóch dysków naprawdę zmniejsza możliwość posiadania współbieżnych URE w tym samym sektorze dysków / LBA.

Jednocześnie programowa macierz RAID (np .: mdadm) jest na ogół znacznie bardziej elastyczna niż sprzętowa macierz RAID, umożliwiając odzyskanie zdegradowanej macierzy RAID5, nawet jeśli zostaną znalezione niektóre URE.

Przywracając dane z kopii zapasowej, na ogół masz bardziej elastyczne narzędzia; oznacza to, że w typowym przypadku można pominąć uszkodzone / nieczytelne sektory i kontynuować odzyskiwanie innych danych.

Shodanshok
źródło
3

Wszystko w tym tomie jest zagrożone

Jeśli oświadczasz, że masz obawy dotyczące URE na woluminie / jednostce LUN, która ucierpiała z powodu awarii dysku RAID 5/6, wówczas wszystkie dane na tym woluminie byłyby zagrożone.

Upewnij się, że przechowujesz dane na innym woluminie / jednostce LUN niż kopia zapasowa. Najlepszą praktyką byłoby stwierdzenie, że twoja kopia zapasowa znajduje się na zupełnie innym urządzeniu pamięci niż dane produkcyjne.

URE jest zwykle na poziomie bloków, więc wszystko w tym tomie byłoby zagrożone korupcją. Format na poziomie bloku jest niski na stosie. NTFS lub VMFS (dowolny format) przechodzi na poziom bloku i tak dalej. Ponieważ poziom bloków na woluminie RAID znajduje się poniżej wszystkiego, na wszystkie dane na tym wpływ mają problemy na poziomie bloków.

Mam nadzieję, że odpowiednio odpowiem na twoje pytanie.

Obywatel
źródło
3

Zasadniczo tak, ale jeśli przechowujesz kopię zapasową na macierzy RAID6 (jako przykład), skorzystasz z nadmiarowości, więc całkowity poziom błędu będzie znacznie niższy, a wraz z nią szansa na URE podczas odzyskiwania.

Jeśli używasz rozwiązania do tworzenia kopii zapasowych na taśmach, wskaźniki błędów są znacznie niższe na początku (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).

Sven
źródło