Co to jest „Raid 5 + Spare” (fragment instrukcji obsługi, rozdział 4.17.2, str. 54 ):
RAID5 + Spare: RAID 5 + Spare to macierz RAID 5, w której jeden dysk jest używany jako zapasowy do odbudowy systemu, gdy tylko dysk ulegnie awarii (ryc. 79). Wymagane są co najmniej cztery dyski. Jeśli jeden dysk fizyczny ulegnie awarii, dane pozostają dostępne, ponieważ są odczytywane z bloków parzystości. Dane z uszkodzonego dysku są przywracane na dysk zapasowy. Po wymianie uszkodzonego dysku wymiana staje się nowym hot spare. Żadne dane nie zostaną utracone w przypadku awarii jednego dysku, ale jeśli drugi dysk ulegnie awarii, zanim system będzie mógł odbudować dane do hot spare, wszystkie dane w macierzy zostaną utracone.
Co to jest „Raid 6” (fragment instrukcji użytkownika, rozdział 4.17.2, str. 54 ):
RAID6: W RAID 6 dane są rozłożone na wszystkie dyski (minimum cztery), a dwa bloki parzystości dla każdego bloku danych (p i q na ryc. 80) są zapisane na tym samym pasku. Jeśli jeden dysk fizyczny ulegnie awarii, dane z uszkodzonego dysku można odbudować na dysku zastępczym. Ten tryb RAID może obsługiwać maksymalnie dwie awarie dysków bez utraty danych. RAID 6 zapewnia szybszą odbudowę danych z uszkodzonego dysku.
Zarówno „Raid 5 + spare”, jak i „Raid 6” są TAK podobne ... Nie mogę powiedzieć różnicy.
Kiedy „Raid 5 + Spare” byłby optymalny?
A kiedy „Raid 6” byłby optymalny?
Podręcznik ogłusza inny nalot 5 gwiazdkami. „Raid 5 + Spare” otrzymuje tylko 4 gwiazdki, ale „Raid 6” otrzymuje 5 gwiazdek. Gdybym ślepo zaufał instrukcji, doszedłbym do wniosku, że „Raid 6” jest zawsze lepszy. Czy „Raid 6” zawsze jest lepszy?
Odpowiedzi:
W skrócie:
Jeśli Twoim głównym celem jest bezpieczeństwo, wybierz RAID6, ponieważ może on przetrwać dwa awarie dysków jednocześnie. Jeśli dysk ulegnie awarii w układzie zapasowym R5 +, nie jesteś bezpieczny przed kolejną awarią, dopóki zapasowy nie zostanie przyspieszony, co może zająć sporo czasu w przypadku dużych dysków (i nie jest to niespotykane w przypadku dysku, który został wyłączony przez wieki, takie jak twoja część zapasowa, aby się nie rozkręciły, kiedy w końcu zostały wezwane)
Jeśli wydajność jest najważniejsza, wybierz 5 + zapasowy, ponieważ wydajność zapisu będzie lepsza, gdy tablica nie będzie w stanie obniżonym - chociaż różnica wydajności między R5 i R6 jest znacznie mniejsza niż różnica między R5 a innymi rozwiązaniami, jeśli masz dobry kontroler (tj. raz, który wykonuje operację częściowego zapisu blokowego „dwa / trzy jednoczesne odczyty, a następnie parzystość oblicz, a następnie dwa / trzy równoczesne zapisy” przez większość czasu zamiast „czytaj-następnie-czytaj (-niej-czytaj) -tąd-parzystość” -calc-then-write-then-write (-then-write) ”, co mogą zrobić niektóre bardzo tanie kontrolery i oprogramowanie RAID.
Edycja: Po raz pierwszy przegapiłem potencjalnie ważny punkt:
źródło
RAID 5 + hot spare:
RAID 6:
W przypadku dowolnej macierzy RAID 5 lub 6 należy zachować ostrożność, używając dysków, które nie pochodzą z tej samej serii produkcyjnej. Może się zdarzyć (widziałem to!), Że po pojedynczej awarii podczas odbudowywania następnej dyski ulegają awarii z powodu zwiększonego obciążenia. Dyski z tego samego uruchomienia mają dokładnie to samo oprogramowanie układowe i prawdopodobnie bardzo podobne właściwości fizyczne.
Edycja: co wybrać
(Zależy to również od wymagań dotyczących wydajności serwera i dopuszczalnego ryzyka).
Jeśli środowisko serwerów jest całkiem niezłe dla sprzętu (colo, klimatyczne itp.), Będziesz w porządku z RAID5 + hot spare.
Jeśli środowisko zwiększa prawdopodobieństwo, że więcej niż jeden dysk ulegnie awarii w krótkim czasie (wibracje, wilgotność, brud), wybierz RAID 6.
Zawsze miej także odpowiednią kopię zapasową i odzyskiwanie testowe.
Edycja 2: Przyzwoite kontrolery RAID mają szorowanie , które okresowo weryfikuje wszystkie sektory.
źródło
RAID5 używa jednego paska parzystości. Konieczne jest obliczenie korekcji błędów Reeda Solomona i napisanie dwóch pasków dla RAID6 vs. jeden dla RAID5. RAID5 jest używany do intensywnych aplikacji bazodanowych, w których pamięć masowa jest ogromna ze względu na koszt RAID10. Koszt RAID5 waha się od 67% do 94% dostępności dysku, przy czym RAID10 wynosi 50% (znacznie wyższe koszty pamięci) Podczas gdy RAID6 ma mniejsze opóźnienie odczytu o bardzo małą ilość z powodu opóźnienia rotacyjnego, RAID6 jest o 25 do 31% wolniejszy przy zapisach z powodu obliczanie korekcji błędów i dodatkowe zapisywanie bitu parzystości.
Wykorzystując średni czas między awariami (MTBF) dla dysków, prawdopodobieństwo awarii dwóch dysków jeden po drugim lub w tym samym czasie wynosi około
(0.1% x 0.1%)*12
lub0.001 x 0.001 * 12
; jeśli masz 1000 uruchomionych dysków, średnio stracisz około 1,2 dysków rocznie. Dwa dyski ulegną awarii jeden po drugim co około 8,3 lat. Ponieważ awaria dysku nie jest rozkładem Poissona z powodu dużych obciążeń dysku podczas przebudowy, prawdopodobieństwo wystąpienia drugiego dysku jest bardziej prawdopodobne w tym okresie, a rozkład jest bliższy rozkładowi gamma z nieco wyższymi wartościami po występuje awaria.Podsumowując, wydajność RAID5 jest lepsza niż RAID6 przy zapisie, a dla aplikacji DB - znacznie lepsza. W przypadku aplikacji głównie do odczytu, takiej jak serwer WWW, nie ma to znaczenia i powinieneś używać RAID6. Korzyści finansowe wynikające z używania RAID5 w porównaniu z RAID10 są ogromne w przypadku dużej pamięci. Jeśli możesz sobie pozwolić na koszty ogólne, użyj RAID10 do aplikacji wymagających dużej ilości dysku. RAID10 zawsze będzie działał lepiej.
Największym brakującym wynikiem jest to, że RAID NIE jest kopią zapasową, ale sposobem na ograniczenie przestojów poprzez zapewnienie redundancji. Jeśli dane są krytyczne, należy wykonać kopię zapasową (i przetestować proces odzyskiwania).
Jeśli jedna macierz RAID 10 dysków 2 TB SAS ulegnie awarii, odzyskiwanie będzie kosztować tysiące dolarów, a odzyskanie danych zajmie tygodnie, nawet jeśli da się to zrobić.
Wszystkie macierze RAID w końcu zawodzą!
źródło
Mówiąc ściśle z punktu widzenia integralności danych, tak. Możesz bezpiecznie stracić dowolne dwa dyski, chociaż rzadko zdarza się, że tracisz dwa razem z powodu poważnych urazów fizycznych w systemie.
Finansowo, nie tak bardzo. Gorący zapasowy można wyłączyć, dopóki nie będzie potrzebny, co oznacza, że nie zużywa energii i nie powoduje zużycia.
I jak zawsze, RAID nie zastępuje właściwego planu tworzenia kopii zapasowych poza witryną.
źródło
Czy wziąłeś pod uwagę 10? Jeśli masz wystarczająco dużo dysków do rajdu 6, masz dość, aby zrobić 10 woluminów. W większości przypadków 10 jest zarówno szybsze, jak i bardziej redundantne (kosztem pewnej przestrzeni dyskowej).
źródło
Te odpowiedzi wydają się niepoprawne, ponieważ opierają się WYŁĄCZNIE na teoretycznej wydajności napędu. Zastanów się, jeśli masz kontroler RAID z 1 GB pamięci podręcznej, wtedy zapis (zwykle przy normalnym obciążeniu - nie w jakimś masywnym niestandardowym scenariuszu wysokiego obciążenia) jest natychmiastowy z perspektywy użytkownika lub aplikacji - poszedł do pamięci, a następnie „rzeczywiste” zapisywanie następuje przy wydajności napędu.
Jednak czytanie nie może być „sfałszowane” (przyspieszone przy użyciu pamięci podręcznej), chyba że te same dane zostały ostatnio lub zwyczajowo już załadowane. Raid 6 jest lepszy do odczytu i bardziej tolerancyjny (2 na jednym dysku). Raid 5 jest wolniejszy w pisaniu i bardzo powolny podczas przebudowy.
Tak więc, podczas gdy RAID 5 byłby powolny w pisaniu, będzie ukryty za pomocą dobrego kontrolera RAID - w którym zapis odbywa się w pamięci z perspektywy użytkownika / aplikacji. Jednak Raid 5 jest wolniejszy niż Raid 6 i nie zostanie poprawiony za pomocą kontrolera, chyba że dane zostały już załadowane lub algorytm nie rejestruje powtarzanych odczytów. W prawdziwym życiu - rajd 6 wygrywa.
Podsumowując, pisanie w RAID 5 jest powolne, ale ukryte z dobrym kontrolerem, co sprawia, że RAID 5 lub 6 jest zasadniczo taki sam z „postrzeganą” wydajnością na piśmie (są pewne wyjątki). Jednak Raid 6 czyta szybciej, a kontrolery prawdopodobnie nie pomogą w rzeczywistym obciążeniu pracą w celu poprawy wydajności odczytu. Dodaj teraz, że Raid 6 może zająć dwie awarie, a Raid 5 + 1 tylko jedną łatwo jest wybrać Raid 6 jako lepszą opcję: nie zapomnij, że przebudowa w Raid 5 jest również bardzo powolna. Dowiedziałem się również, że dyski Raid 6 są używane (tak przetestowane prawidłowo), a dyski, które ulegają awarii, mają tendencję do bardzo szybkiej awarii. Gdy tablica jest aktywna przez ponad 30 dni, trwa zwykle przez lata. Hot spare jest nieprzetestowany i może faktycznie zawieść natychmiast, gdy jest potrzebny.
źródło
Oto fakty sprawy i są bezdyskusyjne (przez każdego, kto wie, o czym mówią):
Jeśli weźmiesz pod uwagę wszystkie możliwe opcje RAID, nie ma przypadku, w którym Hotspare RAID5 + jest najlepszym wyborem, przede wszystkim dlatego, że jeśli masz RAID5 + hotspare, oznacza to, że masz 4 dyski, a przy 4 dyskach możesz zrobić RAID6, a nawet lepiej możesz zrobić RAID10.
Dzięki 4 dyskom zyskujesz taką samą użyteczną pamięć spośród wszystkich opcji (R5 + HS, R6, R10).
Jeśli Twoim celem jest wydajność, wówczas RAID10 będzie lepszy od RAID5 i RAID6.
Jeśli Twoim celem jest bezpieczeństwo, RAID6 lub RAID10 są lepsze niż RAID5 z lub bez hotspare. Można dyskutować, który z nich jest bezpieczniejszy (6 vs 10). RAID6 może wytrzymać 2 awarie dysków, ale z powodu niemożliwych do naprawienia błędów odczytu (URE) możliwe jest również, że awaria jednego dysku w RAID6 zabije całą macierz.
RAID10, ponieważ nie jest oparty na parzystości, nie ma tego samego problemu z URE. Jeśli macierz RAID parzystości (R5 itp.) Utraci dysk, a następnie napotka URE, cała tablica zostanie utracona. W przypadku RAID1 lub RAID10, jeśli dysk zostanie utracony, a następnie na dysku lustrzanym pojawi się URE, utracony zostanie tylko nieczytelny sektor.
Zobacz tutaj szczegółowe wyjaśnienie, dlaczego RAID5 jest najgorszym możliwym wyborem . Zobacz także tutaj listę rozsądnych wyborów RAID według liczby dysków . Zauważ, że w żadnym wypadku RAID5 nie jest najlepszym wyborem (niezależnie od hotspare).
źródło