Czy powinienem używać „Raid 5 + spare” czy „Raid 6”?

12

Co to jest „Raid 5 + Spare” (fragment instrukcji obsługi, rozdział 4.17.2, str. 54 ):

RAID5 + Spare: RAID 5 + Spare to macierz RAID 5, w której jeden dysk jest używany jako zapasowy do odbudowy systemu, gdy tylko dysk ulegnie awarii (ryc. 79). Wymagane są co najmniej cztery dyski. Jeśli jeden dysk fizyczny ulegnie awarii, dane pozostają dostępne, ponieważ są odczytywane z bloków parzystości. Dane z uszkodzonego dysku są przywracane na dysk zapasowy. Po wymianie uszkodzonego dysku wymiana staje się nowym hot spare. Żadne dane nie zostaną utracone w przypadku awarii jednego dysku, ale jeśli drugi dysk ulegnie awarii, zanim system będzie mógł odbudować dane do hot spare, wszystkie dane w macierzy zostaną utracone.


Co to jest „Raid 6” (fragment instrukcji użytkownika, rozdział 4.17.2, str. 54 ):

RAID6: W RAID 6 dane są rozłożone na wszystkie dyski (minimum cztery), a dwa bloki parzystości dla każdego bloku danych (p i q na ryc. 80) są zapisane na tym samym pasku. Jeśli jeden dysk fizyczny ulegnie awarii, dane z uszkodzonego dysku można odbudować na dysku zastępczym. Ten tryb RAID może obsługiwać maksymalnie dwie awarie dysków bez utraty danych. RAID 6 zapewnia szybszą odbudowę danych z uszkodzonego dysku.


Zarówno „Raid 5 + spare”, jak i „Raid 6” są TAK podobne ... Nie mogę powiedzieć różnicy.

Kiedy „Raid 5 + Spare” byłby optymalny?

A kiedy „Raid 6” byłby optymalny?

Podręcznik ogłusza inny nalot 5 gwiazdkami. „Raid 5 + Spare” otrzymuje tylko 4 gwiazdki, ale „Raid 6” otrzymuje 5 gwiazdek. Gdybym ślepo zaufał instrukcji, doszedłbym do wniosku, że „Raid 6” jest zawsze lepszy. Czy „Raid 6” zawsze jest lepszy?

Trevor Boyd Smith
źródło
1
ServerFault ma dobrą dyskusję na ten temat.
Brian
1
Cokolwiek skończysz, rajduj tylko kontrolerem rajdowym, a nie wbudowanym miękkim kontrolerem, który jest dostarczany z twoim mobo. Jeśli twoje mobo zgaśnie, prosisz o kłopoty.
sound2man,
Raid jest przerywany przez kontroler sprzętowy (lol słyszałem zbyt wiele rzeczy przeciwko programowym kontrolerom RAID).
Trevor Boyd Smith

Odpowiedzi:

17

W skrócie:

  • Jeśli Twoim głównym celem jest bezpieczeństwo, wybierz RAID6, ponieważ może on przetrwać dwa awarie dysków jednocześnie. Jeśli dysk ulegnie awarii w układzie zapasowym R5 +, nie jesteś bezpieczny przed kolejną awarią, dopóki zapasowy nie zostanie przyspieszony, co może zająć sporo czasu w przypadku dużych dysków (i nie jest to niespotykane w przypadku dysku, który został wyłączony przez wieki, takie jak twoja część zapasowa, aby się nie rozkręciły, kiedy w końcu zostały wezwane)

  • Jeśli wydajność jest najważniejsza, wybierz 5 + zapasowy, ponieważ wydajność zapisu będzie lepsza, gdy tablica nie będzie w stanie obniżonym - chociaż różnica wydajności między R5 i R6 jest znacznie mniejsza niż różnica między R5 a innymi rozwiązaniami, jeśli masz dobry kontroler (tj. raz, który wykonuje operację częściowego zapisu blokowego „dwa / trzy jednoczesne odczyty, a następnie parzystość oblicz, a następnie dwa / trzy równoczesne zapisy” przez większość czasu zamiast „czytaj-następnie-czytaj (-niej-czytaj) -tąd-parzystość” -calc-then-write-then-write (-then-write) ”, co mogą zrobić niektóre bardzo tanie kontrolery i oprogramowanie RAID.

Edycja: Po raz pierwszy przegapiłem potencjalnie ważny punkt:

  • Jeśli problem dotyczy zużycia energii, R5 + spare będzie miał dodatkową zaletę, jeśli kontroler utrzyma zapasowy napęd w stanie wyłączonym, dopóki nie będzie potrzebny.
David Spillett
źródło
Najbardziej dobrze napisane / zwięzłe. (Podaje oczywiste zalety / wady w pierwszych dwóch słowach każdego punktu ... bardzo, bardzo dobrze).
Trevor Boyd Smith
Byłbym ciekawy, kiedy, jeśli w ogóle, pobór mocy jednego dodatkowego dysku stanie się naprawdę „problemem” w porównaniu do wszystkiego innego w centrum danych / serwerowni itp.
warren
Jeden dysk w jednej maszynie, prawdopodobnie nie. Ale w colo, gdzie dostajesz wzmacniacze X na stelaż i płacisz dużo za każdy nadmiar (lub nadmiar jest po prostu niedozwolony - czasami, jeśli przejdziesz, ciemniejesz), może to być zauważalne. Moc „zużywana” jest również podwójnym uderzeniem: jest przekształcana na hałas i ciepło, a ty w końcu potrzebujesz więcej mocy, aby odepchnąć ciepło. A dla całej klatki lub większego zestawu zestaw całkowity pobór dodatkowego napędu na jednostkę obliczeniową wkrótce stanowi coś, co może dostrzec wystarczająco wybredny księgowy.
David Spillett
7

RAID 5 + hot spare:

  • na równym sprzęcie kontrolera lepsza wydajność niż RAID 6
  • nie możesz stracić 2 dysków jednocześnie . kiedy stracisz dysk, jest czas przebudowy (z hot spare), w którym nie masz redundancji . Wszystko, co zawiedzie w tym czasie, powoduje całkowitą stratę (bez wysyłania czegokolwiek do dobrej firmy ratującej dane i płacenia naprawdę $$$$)

RAID 6:

  • gorsza wydajność niż RAID 5 (w zależności od kontrolera może wahać się od bardzo zauważalnej do praktycznie żadnej różnicy)
  • możesz stracić 2 dyski jednocześnie

W przypadku dowolnej macierzy RAID 5 lub 6 należy zachować ostrożność, używając dysków, które nie pochodzą z tej samej serii produkcyjnej. Może się zdarzyć (widziałem to!), Że po pojedynczej awarii podczas odbudowywania następnej dyski ulegają awarii z powodu zwiększonego obciążenia. Dyski z tego samego uruchomienia mają dokładnie to samo oprogramowanie układowe i prawdopodobnie bardzo podobne właściwości fizyczne.

Edycja: co wybrać

(Zależy to również od wymagań dotyczących wydajności serwera i dopuszczalnego ryzyka).

Jeśli środowisko serwerów jest całkiem niezłe dla sprzętu (colo, klimatyczne itp.), Będziesz w porządku z RAID5 + hot spare.

Jeśli środowisko zwiększa prawdopodobieństwo, że więcej niż jeden dysk ulegnie awarii w krótkim czasie (wibracje, wilgotność, brud), wybierz RAID 6.

Zawsze miej także odpowiednią kopię zapasową i odzyskiwanie testowe.

Edycja 2: Przyzwoite kontrolery RAID mają szorowanie , które okresowo weryfikuje wszystkie sektory.

knitti
źródło
+1 za „mieć odpowiednią kopię zapasową i odzyskiwanie testowe”. To PIERWSZA rzecz, którą każdy powinien mieć, zanim zacznie się martwić poziomem RAID.
warren
3

RAID5 używa jednego paska parzystości. Konieczne jest obliczenie korekcji błędów Reeda Solomona i napisanie dwóch pasków dla RAID6 vs. jeden dla RAID5. RAID5 jest używany do intensywnych aplikacji bazodanowych, w których pamięć masowa jest ogromna ze względu na koszt RAID10. Koszt RAID5 waha się od 67% do 94% dostępności dysku, przy czym RAID10 wynosi 50% (znacznie wyższe koszty pamięci) Podczas gdy RAID6 ma mniejsze opóźnienie odczytu o bardzo małą ilość z powodu opóźnienia rotacyjnego, RAID6 jest o 25 do 31% wolniejszy przy zapisach z powodu obliczanie korekcji błędów i dodatkowe zapisywanie bitu parzystości.

Wykorzystując średni czas między awariami (MTBF) dla dysków, prawdopodobieństwo awarii dwóch dysków jeden po drugim lub w tym samym czasie wynosi około (0.1% x 0.1%)*12lub 0.001 x 0.001 * 12; jeśli masz 1000 uruchomionych dysków, średnio stracisz około 1,2 dysków rocznie. Dwa dyski ulegną awarii jeden po drugim co około 8,3 lat. Ponieważ awaria dysku nie jest rozkładem Poissona z powodu dużych obciążeń dysku podczas przebudowy, prawdopodobieństwo wystąpienia drugiego dysku jest bardziej prawdopodobne w tym okresie, a rozkład jest bliższy rozkładowi gamma z nieco wyższymi wartościami po występuje awaria.

Podsumowując, wydajność RAID5 jest lepsza niż RAID6 przy zapisie, a dla aplikacji DB - znacznie lepsza. W przypadku aplikacji głównie do odczytu, takiej jak serwer WWW, nie ma to znaczenia i powinieneś używać RAID6. Korzyści finansowe wynikające z używania RAID5 w porównaniu z RAID10 są ogromne w przypadku dużej pamięci. Jeśli możesz sobie pozwolić na koszty ogólne, użyj RAID10 do aplikacji wymagających dużej ilości dysku. RAID10 zawsze będzie działał lepiej.

Największym brakującym wynikiem jest to, że RAID NIE jest kopią zapasową, ale sposobem na ograniczenie przestojów poprzez zapewnienie redundancji. Jeśli dane są krytyczne, należy wykonać kopię zapasową (i przetestować proces odzyskiwania).

Jeśli jedna macierz RAID 10 dysków 2 TB SAS ulegnie awarii, odzyskiwanie będzie kosztować tysiące dolarów, a odzyskanie danych zajmie tygodnie, nawet jeśli da się to zrobić.

Wszystkie macierze RAID w końcu zawodzą!

Dr Bombilious
źródło
1

Mówiąc ściśle z punktu widzenia integralności danych, tak. Możesz bezpiecznie stracić dowolne dwa dyski, chociaż rzadko zdarza się, że tracisz dwa razem z powodu poważnych urazów fizycznych w systemie.

Finansowo, nie tak bardzo. Gorący zapasowy można wyłączyć, dopóki nie będzie potrzebny, co oznacza, że ​​nie zużywa energii i nie powoduje zużycia.

I jak zawsze, RAID nie zastępuje właściwego planu tworzenia kopii zapasowych poza witryną.

Ignacio Vazquez-Abrams
źródło
1

Czy wziąłeś pod uwagę 10? Jeśli masz wystarczająco dużo dysków do rajdu 6, masz dość, aby zrobić 10 woluminów. W większości przypadków 10 jest zarówno szybsze, jak i bardziej redundantne (kosztem pewnej przestrzeni dyskowej).

Joel Coehoorn
źródło
10 obsługuje tylko 4 dyski. więc rajd 10 nie jest opcją IMO.
Trevor Boyd Smith
1
@Trevor Raid 10 obsługuje dowolną liczbę parzystych dysków> = 4. Jeśli możesz zrobić nalot 6, możesz zrobić nalot 10.
Joel Coehoorn
1

Te odpowiedzi wydają się niepoprawne, ponieważ opierają się WYŁĄCZNIE na teoretycznej wydajności napędu. Zastanów się, jeśli masz kontroler RAID z 1 GB pamięci podręcznej, wtedy zapis (zwykle przy normalnym obciążeniu - nie w jakimś masywnym niestandardowym scenariuszu wysokiego obciążenia) jest natychmiastowy z perspektywy użytkownika lub aplikacji - poszedł do pamięci, a następnie „rzeczywiste” zapisywanie następuje przy wydajności napędu.

Jednak czytanie nie może być „sfałszowane” (przyspieszone przy użyciu pamięci podręcznej), chyba że te same dane zostały ostatnio lub zwyczajowo już załadowane. Raid 6 jest lepszy do odczytu i bardziej tolerancyjny (2 na jednym dysku). Raid 5 jest wolniejszy w pisaniu i bardzo powolny podczas przebudowy.

Tak więc, podczas gdy RAID 5 byłby powolny w pisaniu, będzie ukryty za pomocą dobrego kontrolera RAID - w którym zapis odbywa się w pamięci z perspektywy użytkownika / aplikacji. Jednak Raid 5 jest wolniejszy niż Raid 6 i nie zostanie poprawiony za pomocą kontrolera, chyba że dane zostały już załadowane lub algorytm nie rejestruje powtarzanych odczytów. W prawdziwym życiu - rajd 6 wygrywa.

Podsumowując, pisanie w RAID 5 jest powolne, ale ukryte z dobrym kontrolerem, co sprawia, że ​​RAID 5 lub 6 jest zasadniczo taki sam z „postrzeganą” wydajnością na piśmie (są pewne wyjątki). Jednak Raid 6 czyta szybciej, a kontrolery prawdopodobnie nie pomogą w rzeczywistym obciążeniu pracą w celu poprawy wydajności odczytu. Dodaj teraz, że Raid 6 może zająć dwie awarie, a Raid 5 + 1 tylko jedną łatwo jest wybrać Raid 6 jako lepszą opcję: nie zapomnij, że przebudowa w Raid 5 jest również bardzo powolna. Dowiedziałem się również, że dyski Raid 6 są używane (tak przetestowane prawidłowo), a dyski, które ulegają awarii, mają tendencję do bardzo szybkiej awarii. Gdy tablica jest aktywna przez ponad 30 dni, trwa zwykle przez lata. Hot spare jest nieprzetestowany i może faktycznie zawieść natychmiast, gdy jest potrzebny.

Trevor
źródło
0

Oto fakty sprawy i są bezdyskusyjne (przez każdego, kto wie, o czym mówią):

  1. Hotspare RAID5 + jest dosłownie najgorszym możliwym wyborem macierzy RAID, jaki możesz wybrać.
  2. RAID10 powinien być domyślnym wyborem, jeśli dbasz o swoje dane (co oznacza, że ​​zależy od nich, na przykład, aby utrzymać działalność).

Jeśli weźmiesz pod uwagę wszystkie możliwe opcje RAID, nie ma przypadku, w którym Hotspare RAID5 + jest najlepszym wyborem, przede wszystkim dlatego, że jeśli masz RAID5 + hotspare, oznacza to, że masz 4 dyski, a przy 4 dyskach możesz zrobić RAID6, a nawet lepiej możesz zrobić RAID10.

Dzięki 4 dyskom zyskujesz taką samą użyteczną pamięć spośród wszystkich opcji (R5 + HS, R6, R10).

Jeśli Twoim celem jest wydajność, wówczas RAID10 będzie lepszy od RAID5 i RAID6.

Jeśli Twoim celem jest bezpieczeństwo, RAID6 lub RAID10 są lepsze niż RAID5 z lub bez hotspare. Można dyskutować, który z nich jest bezpieczniejszy (6 vs 10). RAID6 może wytrzymać 2 awarie dysków, ale z powodu niemożliwych do naprawienia błędów odczytu (URE) możliwe jest również, że awaria jednego dysku w RAID6 zabije całą macierz.

RAID10, ponieważ nie jest oparty na parzystości, nie ma tego samego problemu z URE. Jeśli macierz RAID parzystości (R5 itp.) Utraci dysk, a następnie napotka URE, cała tablica zostanie utracona. W przypadku RAID1 lub RAID10, jeśli dysk zostanie utracony, a następnie na dysku lustrzanym pojawi się URE, utracony zostanie tylko nieczytelny sektor.

Zobacz tutaj szczegółowe wyjaśnienie, dlaczego RAID5 jest najgorszym możliwym wyborem . Zobacz także tutaj listę rozsądnych wyborów RAID według liczby dysków . Zauważ, że w żadnym wypadku RAID5 nie jest najlepszym wyborem (niezależnie od hotspare).

użytkownik1594322
źródło
2
Nie zgadzam się. RAID5 ma swoje zastosowania. (np. gdy budżet jest napięty i naprawdę potrzebujesz miejsca na dysku). A ponieważ RAID nie zastępuje kopii zapasowej, która przetrwała awarię jednego dysku, wystarczy, aby przetrwać do godziny 17:00, w którym to momencie ludzie opuszczają biuro, a Ty zajmujesz się konserwacją wschodzącą.
Hennes,
Istnieje różnica między „najlepszym wyborem” a „najlepszym wyborem, na jaki możesz sobie pozwolić”. RAID5 nigdy nie jest najlepszym wyborem. Ludzie przychodzą tutaj, aby uzyskać najlepszą odpowiedź, a ludzie powinni wyjść, wiedząc, że RAID5 jest zawsze mniej niż najlepszy. Jest matematycznie udowodnione, że w niektórych przypadkach RAID0 jest bardziej niezawodny niż RAID5. Tak straszny jest RAID5. W wielu przypadkach RAID5 może nie dotrzeć do 5 po południu. Jeśli chodzi o RAID5, istnieje duża różnica między teorią a światem rzeczywistym. Zobacz tutaj
użytkownik1594322
Nie jest dla mnie jasne, dlaczego mówisz, że RAID10 nie ma tego samego problemu z URE. W przypadku konfiguracji RAID10 z czterema dyskami, jeśli stracisz jeden dysk i pojawi się URE na odpowiadającym mu lustrze, jesteś równie niezadowolony.
ChrisInEdmonton
Jeśli RAID10 ma uszkodzony dysk, a następnie ma URE na dysku, który przetrwał, tracisz tylko nieczytelny sektor, a nie całą macierz. Zaktualizowałem odpowiedź.
user1594322