RAID 6 czy RAID 10? Które byś wybrał

11

Moim wyborem będzie RAID 6 dla serwera plików, ponieważ możesz stracić dwa dyski i nie ma znaczenia, który zestaw dwóch może zginąć. Z tego, co rozumiem z RAID 10, możesz stracić dwa dyski, ale jeśli zdarzy się, że znajdują się na tej samej macierzy RAID 1, to nie masz szczęścia? Jakieś sugestie? Podstawowy serwer plików z około 200 GB danych i działałby jako pojedynczy punkt kopii zapasowej dla innych stacji roboczych i serwerów.

dasko
źródło
„pojedynczy punkt kopii zapasowej” oznacza repozytorium kopii zapasowych z całej sieci. to jest twój pojedynczy punkt, który następnie tworzysz na nośniku. nigdy nie utworzyłbym kopii zapasowej jednego serwera, a potem drugiego. zadziałałoby, gdybyś miał tylko jeden, mamy około 10.
Jeśli Twoim prawdziwym celem jest posiadanie „bezpiecznego” miejsca do przechowywania kopii zapasowych, to po prostu kupiłbym stos dysków, a następnie zamieniałem dyski codziennie i umieszczałem nieużywane w bezpiecznym miejscu, a nawet poza miejscem pracy w bezpiecznym miejscu . RAID pomoże jedynie w wydajności i czasie pracy nawet w przypadku awarii jednego dysku, ale nie w przypadku stopienia się serwera lub spalenia budynku. W przeszłości robiono to z napędami taśmowymi, ale w dzisiejszych czasach dodatkowe dyski są prawdopodobnie znacznie bardziej ekonomicznym sposobem i łatwiejszym w zarządzaniu.
Jed Daniels,
dasko, czy któryś z poniższych elementów odpowiada na twoje pytanie?
James Cape

Odpowiedzi:

12

To zależy od tego, co próbujesz zrobić. Podczas gdy Raid 10 zapewnia szybsze odczytywanie i zapisywanie tych dwóch elementów, tak jak powiedziałeś, możliwe jest stracenie wszystkiego, jeśli stracisz niewłaściwe dwa dyski. Ale na większych macierzach dyskowych możesz stracić dokładnie połowę dysków i zachować pełne operacje. Ale w Raid 6 twoje zapisy mogą być nieco wolniejsze b / c dodatkowej sumy kontrolnej. Ale możesz stracić dowolne dwa dyski i nie utracić żadnych danych.

Myślę, że inną ważną rzeczą do zapamiętania jest to, że Raid nie jest kopią zapasową danych . Dlatego najważniejszą rzeczą, na którą należy zwrócić uwagę na RAID, jest czas pracy serwera. Nieutrzymywanie danych nienaruszonych.

Myślę, że ostatecznie jest to kwestia preferencji. Wybrałbym Raid 10 osobiście; W przypadku naprawdę dużych tablic możesz wyciągnąć RAID 50 lub 60. Gdzie dysk w zestawie w paski może być chroniony przez RAID 5 lub RAID 6.

Dobra lektura:

Ryan Gibbons
źródło
2
Chociaż RAID nie jest kopią zapasową ... w tym przypadku myślę, że jego definicja kopii zapasowej jest dobra. Ponieważ oryginalne dane znajdują się na stacjach roboczych i innych serwerach i są tworzone kopie zapasowe na tym serwerze. Co dzieje się przy użyciu RAID, aby pomóc w dostępności.
3dinfluence
5
Pozwól mi dodać: kopia zapasowa online nie jest kopią zapasową. Jeśli jest to kopia zapasowa, powinna być przechowywana na taśmach / dyskach i przechowywana w sejfie z dala od reszty systemów. RAID nie pomaga w tym.
pehrs
1
Myślę, że zależy to również od rodzaju używanych dysków, ale dla podstawowego serwera plików wystarcza RAID 6. Zarezerwuj RAID 10 dla serwera SQL o wysokim obciążeniu.
murisonc
4
@cypher Online systemy tworzenia kopii zapasowych mają dwie bardzo paskudne właściwości: 1: Możliwe jest wyczyszczenie całej kopii zapasowej przez wypadki lub błędy w systemie tworzenia kopii zapasowych, często bez zauważenia. Weryfikacja i przywracanie z systemu offline odbywa się tylko do odczytu, co zmniejsza ryzyko tworzenia kopii zapasowych. 2: Kopia zapasowa online najprawdopodobniej nie znajduje się w ognioodpornym sejfie bez połączeń zewnętrznych. Po tym, jak elektryk poda napięcie 480 V do serwerowni, nauczysz się tej lekcji.
pehrs
2
Głównym problemem związanym z raidem jest to, że napędy są ciągle w użyciu i podlegają zużyciu, co znacznie zwiększa prawdopodobieństwo awarii niż napęd offline lub kopia zapasowa taśmy. Ponadto nie chroni przed uszkodzeniem danych ani replikowanym usuwaniem. Napędy taśm / offline mogą mieć własne problemy, jedynym bezpiecznym sposobem jest wielostopniowe.
JamesRyan,
7

[Zakładam, że nie masz nic przeciwko wydajności RAID6 i martwisz się tylko awariami]

Używam numery od http://en.wikipedia.org/wiki/Standard_RAID_levels , a ja ssać z matematyki, więc to może być źle. Załóżmy, że 5% twoich dysków umrze w ciągu 1 roku.

Prawdopodobieństwo podwójnego członka RAID1 wręcz umierający jest prawdopodobieństwo danego napędu umierającej kwadratu: P(R1) = P(drive)^2.

Dzięki 5% wskaźnikowi awarii uzyskujesz:

P(R1) = 0.005^2 = 0.0025 = 0.25%

(Tutaj nie jestem pewien co do matematyki - to ma sens, ale to nic nie znaczy)

Więc szanse na utratę dowolnego członka R1 wynoszą 0,25% rocznie, ale masz kilka pasków razem, a jeśli któryś z nich umrze, twoja tablica jest martwa. więc trzeba podłączyć P (R1) numer w niewydolności matematyki R0: P(R10) = 1 - (1 - P(R1))^(n_R1). Załóżmy, że masz w sumie 8 dysków (i nie wymieniaj ich, gdy ulegną awarii), więc pasek na 4 R1s:

P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%

Masz więc około 1% szansy na utratę RAID10, który ma 8 dysków z 5% szansą na awarię rocznie.

Mówiąc prościej, prawdopodobieństwo awarii RAID6 to prawdopodobieństwo zginięcia dowolnego dysku, pokrytego kostką (ponieważ musisz stracić trzy dyski, aby mógł ulec awarii), np .:

P(drive)^3 = (5%)^3 = 0.0125%

Tak więc w scenariuszu „umierania wielu dysków” RAID6 ma około 1/80 prawdopodobieństwa awarii jako RAID10 z tymi samymi dyskami.

Niestety życie jest skomplikowane i musisz radzić sobie z sektorami, które mają się źle. Jest całkiem prawdopodobne, że przypadkowe błędy zostaną wprowadzone na dyski, które pozostaną niezauważone. Nie kopiuję już tutaj wikipedii, ale domyślam się, że na danym dysku pojawi się zły sektor P(bs) = P(UBER) * bits_written. Jeśli tak się stanie, odzyskanie po awarii dysku jest niemożliwe w R1, a trudniejsze w R6.

Oczywiście wszystko to jest dyskusyjne, jeśli kontroler lub sterownik RAID6 jest wadliwy i wprowadza błędy do danych lub psuje tablicę :-)

James Cape
źródło
2
Ta matematyka jest dobra, ale podczas przebudowy dyski parzystości / kopii lustrzanych są uderzane bardziej niż jakikolwiek inny, a zatem są znacznie bardziej podatne na awarie niż średni wskaźnik awaryjności. Zatem RAID10 może nawet stracić ten konkretny drugi dysk.
JamesRyan,
1
parzystość / dublowanie to 1 dysk w RAID10, ale rozłożony na wszystkie dyski w RAID6
JamesRyan
2
Inną kwestią jest to, że dyski zakupione w partiach zwykle giną w partiach, co sprawia, że ​​awarie wielu dysków są częstsze niż sugerowałaby prosta matematyka. (Lekcja nauczyła się na
własnej skórze
1
Chociaż RAID10 jest zwykle budowany przy użyciu tylko 2-dyskowych par RAID1, nie zawsze tak jest. Linux mdadmpozwala utworzyć układ RAID10 z dowolnym poziomem redundancji (2, 3, 4, ...), o ile jest on niższy niż liczba dysków w macierzy (więc możliwe jest utworzenie RAID10 z dwiema kopiami danych z tylko 3 dyski). --layout=Opcja pozwala ustawić liczbę kopii.
Hubert Kario
2

W przypadku stacji roboczej lub serwera obciążającego głównie procesor, głosowałbym na RAID 10 za lepszą wydajność odczytu / zapisu.

W przypadku serwera do przechowywania danych wybrałbym RAID 6.

Jeśli to możliwe, używałbym RAID 10 na mojej stacji roboczej i serwerach oraz RAID 6 na serwerze plików, aby zachować kopie zapasowe plików.

wag2639
źródło
0

Serwery plików są zwykle bardziej związane linkiem sieciowym. Tak więc dla typowego serwera plików wybrałbym dodatkową ochronę, jaką oferuje RAID6, ponieważ pod koniec dnia prędkość w sieci będzie miała wąski gardło.

Jeśli na serwerze działa coś lokalnego, na przykład duża baza danych lub maszyny wirtualne, wybrałbym konfigurację RAID10.

3dinfluence
źródło
0

Raid6 jest znacznie bezpieczniejszy niż R1. Prawdopodobieństwo wynosi 5%, że dysk ulegnie awarii w ciągu jednego roku. Raid6 zakończy się niepowodzeniem, jeśli 3 dyski umrą tego samego dnia. Prawdopodobieństwo tego wynosi 0,05 * 1/365 = 0,000014. Zatem prawdopodobieństwo niepowodzenia Raid6 wynosi 2,6 E-12, co jest znacznie mniejsze niż prawdopodobieństwo wygranej w loterii. Jeśli dysk ulegnie uszkodzeniu w macierzy Raid6, możesz go zmienić, a kontroler RAID natychmiast rozpocznie przebudowywanie macierzy RAID. To zajmuje aplikację. 1 dzień do f. dawny. przebudowany dysk 2 TB na macierzy Raid6. Dlatego musisz mieć awarie w ciągu jednego dnia lub nawet krócej, jeśli używasz dysku mniejszego niż 2 TB.

Ale jak powiedziano tutaj, utrzymuj trochę prawdziwych kopii zapasowych w sposób ciągły. Pewnego dnia twoje źródło zasilania może umrzeć i nadać Twojemu systemowi dodatkowe napięcie, a potem wszystkie dyski twarde mogą być offline, właśnie tak (lub dzieje się coś dziwnego, kto wie). Zwykle takie sytuacje się nie zdarzają, ale jeśli naprawdę potrzebujesz swoich danych, zabierz je gdzie indziej niż do macierzy RAID.


źródło