Czy RAID 0 jest tak ryzykowny, jak mówią ludzie?

9

Właśnie zamierzam skonfigurować dyski twarde z macierzą RAID 0. Czy to naprawdę tak ryzykowne, jak ludzie mówią?

quack quixote
źródło

Odpowiedzi:

22

RAID 0 podwaja szansę na awarię pamięci (przy założeniu, że RAID 0 na 2 dyskach). Dlaczego? Ponieważ teraz polegasz na niezawodności 2 dysków zamiast jednego.

RAID 10 przywraca rozsądny poziom niezawodności.

kmarsh
źródło
RAID10 to tylko „rozsądny” poziom niezawodności?
Josh
52
@Josh: Tak. Fire nie sprawdza poziomu RAID skonfigurowanego na serwerze.
@womble +1 - to całkiem zabawne :)
Coops
2
Obowiązkowe „RAID nie jest kopią zapasową”. Ogień, ogień, ogień!
Bratch
2
@womble: Twój komentarz jest bardziej głosowany niż ta odpowiedź, a pytanie łącznie.
Macha
8

RAID 0 oznacza redundancję ZERO. Ilekroć są dane do zapisania na urządzeniu RAID, są one dzielone na dwie części, pierwsza część jest zapisywana na pierwszym dysku, druga część na drugiej, co sprawia, że ​​operacja zapisu jest dość szybka. Ale jeśli któryś z dysków ulegnie awarii, wszystkie dane zostaną utracone (ponieważ stracisz (z grubsza) 50% wszystkich plików, czyniąc je bezużytecznymi)

soulmerge
źródło
8
Aby wyjaśnić „stracić 50% wszystkich plików” ... Połowa każdego pliku zostaje utracona; nie możesz odzyskać 50% liczby posiadanych plików. Chociaż niektóre drogie usługi rekonstrukcji danych mogą być bardzo bliskie ... czasami.
tsilb
Ach, tak to pamiętasz, która jest która! duh
Simon
7

Tak. Jeśli stracisz tylko jeden dysk w macierzy, stracisz wszystko. Co oznacza, że ​​wszystko na RAID 0 musi mieć kopię zapasową .

Josh
źródło
17
Nawet jeśli używasz czegoś innego niż RAID 0, nadal musisz mieć kopie zapasowe.
Juliano,
3
Tak, patrz także: serverfault.com/questions/2888/why-is-raid-not-a-backup
ThatGraemeGuy
@Juliano, tak, masz rację. Myślę, że jeśli masz RAID 0, „zdecydowanie absolutnie naprawdę musisz mieć kopie zapasowe”?
Josh
2
Jeśli nie „absolutnie całkowicie ufasz” swojej kopii zapasowej, nie jest to kopia zapasowa. Celem kopii zapasowej jest przywrócenie. Jeśli nie testujesz tego i jesteś pewien sukcesu przywracania, to nie jest to kopia zapasowa.
Evan Anderson
1
RAID nie jest kopią zapasową. Cokolwiek nie zostało przywrócone testowo, nie jest kopią zapasową. Wszystko, co jest podatne na te same rzeczy, co pamięć główna, nie jest kopią zapasową. I tak, RAID0 ulegnie awarii bardziej niż inne magazyny.
David Thornley,
6

To zależy od tego, do czego go używasz. Jak powiedzieli inni, z grubsza podwaja ryzyko awarii danych na nim w porównaniu z pojedynczym dyskiem. Jeśli miałeś 3 dyski w rajdzie 0, to 3 razy ryzyko itp. To dlatego, że tracisz prawie wszystkie dane, jeśli jeden dysk ulegnie awarii. RAID działa na niskim poziomie, więc na ogół nie umieszcza jednego pliku na jednym dysku, a drugiego pliku na drugim dysku , ale raczej dzieli plik na wszystkie dyski.

Jeśli jednak masz kopię zapasową i są to dane statyczne, a czas pracy nie ma tak naprawdę znaczenia, nie jest to niebezpieczne . Na przykład mogę użyć RAID 0 na komputerze do gier z moimi zapisanymi plikami na innym dysku. W ten sposób poziomy ładowanie będzie szybkie :-) Jednak w przypadku odpowiednich zastosowań IT nie jest to idealny wybór.

Sytuacją IT byłyby nadmiarowe maszyny ze statycznymi danymi. W takim przypadku można zejść na chwilę z maszyny.

Wreszcie, dyski twarde są mechaniczne i pękają dość często . Może się to nie zdarzyć, jeśli masz tylko kilka komputerów stacjonarnych, ale z serwerownią i dużą ilością dysków będziesz je dość często zastępował.

Kyle Brandt
źródło
Jestem względnie nowy, a słowa „błąd serwera” nie ma w moim słowniku, więc muszę zapytać, co to jest: „sytuacja błędu serwera”, „odpowiednie zastosowania błędu serwera”. Czy błąd serwera jest jak zwiadowca czy coś takiego? Dostajemy odznaki? Jesteśmy zawsze przygotowani? Ten język jest dla mnie dziwny.
labradort
Przepraszam. Jest superużytkownik dla użytkowników pulpitu i Serverfault dla administratorów systemu. Kiedy mówiłem o błędzie serwera, miałem na myśli IT lub dużą skalę. Zobacz najczęściej zadawane pytania Link w prawym górnym rogu tej strony.
Kyle Brandt
3

Tak to jest. masz 2 dyski, nalot 0 - jeśli jeden zawiedzie, wszystkie dane zostaną utracone. jeśli nie użyjesz raidu - jeśli 1 się nie powiedzie, stracisz 50% danych ...

JEŻELI korzystasz z rajdu 1 - jeśli 1 się nie powiedzie - tracisz 0% danych, ale płacisz dwa razy za swój sprzęt .... :-)

Dani
źródło
3

Mówiąc o osobistym doświadczeniu utraty danych, zdecydowanie zaleciłbym, abyś oszczędził sobie bólu głowy i uniknął RAID 0. Dla każdego dysku w macierzy zwiększasz szanse na utratę wszystkich danych. Miałem 3 dyski w macierzy RAID 0, a dysk środkowy zepsuł się zaledwie kilka miesięcy później, tracąc prawie 1 TB danych.

Drarok
źródło
4
Z mojego doświadczenia wynika, że ​​jeśli jeden dysk ulegnie awarii, inne też będą gotowe. Tak więc nie martwię się tak bardzo o RAID 0. Po prostu rób kopie zapasowe. Zgubiłem 2 dyski z 4-dyskowej macierzy RAID 5 tego samego dnia, a następnie przebudowałem, straciłem trzeci oryginalny dysk tydzień później ... Jeśli to możliwe, unikaj dysków w tym samym wieku z tej samej partii w macierzach RAID z każdego gatunku? :-)
Brian Knoblauch,
@Brian, to świetny punkt na końcu. Tego samego dnia mieliśmy 17 awarii dysków w kilku naszych urządzeniach SAN w pracy. Wszyscy byli w tym samym wieku i partii urządzeń.
David Rickman
@Brian Knoblauch: Całkowicie nie rozumiem, o co ci chodzi: Jak możesz nie martwić się o RAID0 tylko dlatego, że jeśli jeden dysk ulegnie awarii, inne wkrótce to zrobią? W przypadku RAID1, RAID5 lub RAID10, jeśli jeden dysk ulegnie awarii, nie stracisz danych. Dzięki RAID0 tracisz wszystkie swoje dane. Nie ma znaczenia, czy inne dyski już niedługo ... Mam na myśli, że ma to znaczenie , ponieważ planuję wkrótce wymienić inne ... ale z RAID0 wszystko stracisz. Inne dyski, które wkrótce się pojawią, nie mają na to wpływu.
Josh
@Josh: Uważam, że jego celem jest to, że potrzebujesz kopii zapasowych bez względu na wszystko. Pamiętaj, że utrata dwóch dysków z RAID 5 również powoduje utratę danych, więc nie jest to bezpieczne. Biorąc to pod uwagę, wygląda na to, że użycie dysków w tym samym wieku w RAID 0 może być rozsądne, ale wymień oba, jeśli jeden dysk ulegnie awarii.
David Thornley,
1

Nie sądzę, aby Raid 0 był w ogóle ryzykowny. Osobiście prowadzę rajd 0 dla mojej OS za zwiększoną prędkość. Możesz skonfigurować moją konfigurację rajdową o każdej porze każdego dnia, a ja nic nie stracę. Mam poprawnie skonfigurowany system, aby uzyskać korzyści wynikające z szybkości, a jednocześnie mieć niewielką lub żadną możliwą utratę danych.

Jedyne ryzyko dotyczy osób, które nie wiedzą, jak je rozdzielić.

Mogę powiedzieć powyższe, ponieważ po prostu pracuję tylko na ważnych plikach na innym dysku niż ten, który jest używany do przechowywania mojego systemu operacyjnego. Instaluję aplikacje i inne rzeczy na głównym dysku systemu operacyjnego, ale ich pliki konfiguracyjne i takie są na dysku dodatkowym. Ten drugi dysk jest następnie kopią lustrzaną na innym dysku, a następnie co tydzień wykonuję kopie zapasowe tego dysku na dysku zewnętrznym. Jeśli mój Raid 0 (OS Drive) ulegnie awarii, po prostu wyciągam dysk / s i wkładam inny. Weź Linux Live CD i użyj programu takiego jak dd lub cat, aby skopiować już wykonany obraz na dyski RAID . Ponownie uruchamiam, a teraz mój system jest z powrotem w nieskazitelnym stanie.

Rekurencja
źródło
0

W 99% przypadków RAID-0 będzie prawdopodobnie złym pomysłem ze wszystkich powodów, o których wspominali inni ludzie (zwiększone prawdopodobieństwo całkowitej awarii itp.).

Można go jednak użyć w niektórych (bardziej ekstremalnych) sytuacjach, na przykład na dużej grupie serwerów współpracujących (a la google), w których awarie poszczególnych komputerów nie wpływają krytycznie na końcowy wynik, ale RAID-0 jest szybki i tani sposób na zwiększenie pojemności.

Ale żeby być brutalnie szczerym i nie próbować być wrednym, ale jeśli zadajesz takie pytanie, nie będziesz w drugiej grupie administratorów serwerów :)

Coops
źródło
0

Wielu facetów mówi o prawdopodobieństwie i są w błędzie! Jeśli chcesz ryzykować użycie rajdu 0, tak to się oblicza.

Załóżmy, że prawdopodobieństwo awarii twardego1 wynosi p1 (w naszym przedziale czasowym), a twarde2 to p2, gdy występuje obwód szeregowy, ponieważ uszkodzenie jednego twardego spowoduje uszkodzenie obwodu.

Aby obliczyć ryzyko, mamy: ryzyko = (1-p1) * (1-p2)

Na przykład, jeśli prawdopodobieństwo awarii hard1 i hard2 wynosi 0,001, ryzyko wynosi: 0,998001

Jak widać awaria 2 dysków twardych jest prawie taka sama, jak prawdopodobieństwo 1 awarii dysku twardego, która nie jest zbyt wysoka.

Ale jest tu coś jeszcze, co zmienia sytuację i polega na tym, że nie można zbyt łatwo odzyskać plików z uszkodzonych dysków RAID, właściwie z mojego doświadczenia jest to niemożliwe.

Ehsan.b
źródło
2
(1-p1) to szansa na prawidłowe działanie. Ich pomnożenie (1-p1) * (1-p2) jest zmianą działania obu urządzeń.
kolypto
1
Wcześniej czy później każdy dysk zawiedzie. Nie chodzi o to, czy, ale kiedy. W związku z tym, ponieważ nie wskazałeś okresu czasu na wykonanie jakichkolwiek obliczeń, prawdopodobieństwo może wynosić tylko 100%.
1
Nie wspominając już o tym, że w przypadku małych szans na awarię szansa, że ​​jeden z dwóch dysków ulegnie awarii, jest prawie dwa razy większa niż jedna. .999 nie jest prawie taki sam jak .998001, jeśli zaczynasz ryzykować awarię od nowa.
David Thornley,
3
Prawdopodobieństwa nie są niezależne, ponieważ oba dyski są prawdopodobnie takie same i działają w tym samym środowisku. Dlatego nie można po prostu pomnożyć wartości.
liori
myślę, że to tylko prawdopodobieństwo, że obaj zawiodą jednocześnie ...
ultrajohn
0

Czynnik ryzyka korzystania z RAID 0 zależy w dużej mierze od tego, co zamierzasz z niego korzystać.

Jeśli chodzi o moje doświadczenie, zacząłem używać RAID 0 rok temu, używając 2 niedrogiego dysku w celu poprawy wydajności w grach i niektórych edycji wideo oraz 1 dużego dysku twardego do prostego przechowywania. Tworzę kopie zapasowe wszystkich moich ważnych danych tam, gdzie uważam je za bezpieczne.

Co mam zrobić, jeśli jeden (lub oba) dyski zginą na mnie? Mam obraz SO z zainstalowanymi wszystkimi moimi programami i sterownikami, więc wyrzucę wadliwy dysk, wykorzystam drugi, dopóki nie umrze jak jego brat, kupię kilka zupełnie nowych i ponownie zbuduję macierz i postaraj się opuścić mój komputer tak, jak chcę.

LaughingMan
źródło
0

Wierzę, że raid5 da ci pewne korzyści zarówno z raid0, jak i raid1, więc zyskasz zarówno zwiększoną prędkość, jak i redundancję w porównaniu z używaniem tylko jednego napędu. Zajmuje minimum trzy dyski.

Fred
źródło
2
Zauważ, że raid5 jest dość zły w przypadkowych zapisach, ponieważ musisz wykonać 3 IO (odczyt i dwa zapisy), aby zaktualizować pojedynczy izolowany blok. To gorsze niż albo raid0 (jeden zapis), albo raid1 (dwa zapisy)
Captain Segfault
0

Teoria prawdopodobieństwa mówi, że P1 to prawdopodobieństwo awarii urządzenia-1, a P2 - dla urządzenia-2, wówczas awaria któregokolwiek z nich występuje z szansą na P1 + P2. Oznacza to, że szanse na utratę danych są naprawdę wyższe - w rzeczywistości - dwa razy wyższe.

Praktycznie mam RAID 0 i to nie zawodzi: dyski twarde mają 1-2 lata gwarancji stabilności i często działają w tym okresie dobrze. Możesz monitorować ich parametry SMART, aby upewnić się, że tablica nie zawiedzie się nieprzewidywalnie.

Uważam, że obecnie dyski twarde są najwolniejszą częścią komputera. Korzystając z RAID 0, zdałem sobie sprawę, że wszystko działa DUŻO szybciej, a cały system jest bardziej responsywny: ładowanie systemu operacyjnego, ładowanie miękkie… Właściwie teraz jestem zmęczony za każdym razem, gdy muszę dotykać systemów bez RAID w środku :)

Jednak, jak powiedział Josh, musisz robić kopie zapasowe. Nie tylko podczas korzystania z macierzy RAID;)

kolypto
źródło
2
To nie jest poprawne Jeśli oba urządzenia mają 50% szansy na awarię w ciągu 5 lat, nie ma 50% + 50% = 100% szansy, że jedno z nich ulegnie awarii w ciągu 5 lat.
Amok
Nie, to prawda. Mamy tutaj prawdopodobieństwo (FAIL-1 lub FAIL-2), czyli tak naprawdę prawdopodobieństwo (FAIL-1) + prawdopodobieństwo (FAIL-2). Sprawdź to: en.wikipedia.org/wiki/Probability#Mathematical_treatment
kolypto
3
Nie, to źle. Przeczytaj ponownie własne źródła. Nie próbuj dołączać matematyki, jeśli nie zamierzasz na nią zwracać uwagi.
Zac Thompson,
2
„Dyski twarde mają 1-2 lata gwarancji stabilności”. Jeśli dysk ulegnie awarii, otrzymasz rekompensatę proporcjonalnie za pozostały czas gwarancji. NIE otrzymasz rekompensaty za utracone dane. Co więcej, SMART nie zapobiegnie, ani niekoniecznie ostrzeże przed całkowitą i nagłą awarią napędu, jak to często obserwujemy. Po co ryzykować z pojedynczym najbardziej zawodnym komponentem w komputerze?
1
Jeszcze lepszym przykładem jest, powiedzmy, 80%. Prawdopodobieństwo awarii nie wynosi oczywiście 160%. Prawdopodobieństwo awarii dowolnego dysku to P1 + P2 - P1 x P2, więc gdyby oba były równe 80%, ogólne prawdopodobieństwo wyniósłoby 96%. Prawdopodobieństwo obu napędów upadających P1 x P2, która byłaby 64% za pomocą tego przykładu (tak przy użyciu dwóch dysków jest lepszy - na pewno szanse jakiegoś wzrostu utraty danych, ale prawdopodobieństwo utraty konkretnego kawałka danych jest zmniejszona ).
Wstrzymano do odwołania.
0

RAID 0 może być świetnym rozwiązaniem w wielu przypadkach, w których przestoje nie są krytyczne.

RAID zapewnia szybkość, nadmiarowość lub jedno i drugie. RAID nie jest rozwiązaniem kopii zapasowej, ponieważ chroni tylko przed awarią sprzętu, tylko jeden typ awarii, który może powodować utratę danych. Oznacza to, że musisz mieć rozwiązanie do tworzenia kopii zapasowych niezależnie od używanego typu macierzy RAID.

Bez względu na typ macierzy RAID zmniejszysz wydajność w przypadku awarii dysku lub przebudowy macierzy, a ponieważ w dzisiejszych czasach dyski twarde stają się coraz większe, a prędkość jest mniej lub bardziej stabilna - odbudowany czas może rozciągać się na dni lub nawet tygodnie i niepotrzebnie obciążają dyski.

Osobiście wolę uruchomić RAID 0, który w przypadku awarii dysku zostanie przywrócony z kopii zapasowej. Dla mnie jest to szybsze, tańsze i mniej stresujące rozwiązanie, ponieważ trochę przestojów nie jest tak naprawdę problemem.

Pamiętaj, że podczas odbudowywania tablicy każdy blok danych jest odczytywany / zapisywany na wszystkich dyskach, niezależnie od ilości użytecznych danych na dyskach. W praktyce zwykle przekłada się to na znacznie szybsze odbudowywanie danych z kopii zapasowej w porównaniu do odbudowy RAID po awarii dysku. W połączeniu ze znacznie mniejszą liczbą cykli zapisu / odczytu podczas normalnej pracy RAID 0 w porównaniu z RAID 1/10 lub RAID 5/6 przełoży się to ogólnie na mniej awarii dysków.

Wszystkie powyższe są prawdziwe, jeśli masz solidną strategię automatycznego tworzenia kopii zapasowych, na przykład:

  • ciągłe tworzenie kopii zapasowych na gorących plikach
  • codzienne kopie zapasowe zimnych (ish) plików
  • cotygodniowe kopie zapasowe wszystkich plików na nośniku znajdującym się zdalnie.

Aby zminimalizować przestoje, nawet w przypadku korzystania z RAID 0, możesz utworzyć kopię zapasową gorących danych na szybkich nośnikach, takich jak i zewnętrzny dysk SSD, ponieważ gorący zestaw danych jest zwykle mały, a zewnętrzne dyski SSD są obecnie dość tanie, a kopie zapasowe zimnych danych na wolnych nośnikach. Większość komercyjnych systemów NAS, nawet tych tanich, będzie w stanie zrobić to za Ciebie w dzisiejszych czasach bez większych problemów.

W systemach o znaczeniu krytycznym powyższe nie ma znaczenia, ponieważ przestoje nie są tak naprawdę opcją, ale nawet wtedy istnieją jeszcze lepsze rozwiązania - takie jak replikacja migawek w ZFS, brtfs lub kasowanie danych lub redundancja serwera z zainstalowanymi systemami przełączania awaryjnego.

Marius P.
źródło