RAID5 vs RAID4 ma zmienną parzystość

9

Nadal nie rozumiem, dlaczego RAID5 jest lepszy niż RAID4. Rozumiem oba bity parzystości, które są używane do odzyskiwania, jeśli wystąpi jakaś awaria, jedyną różnicą jest przechowywanie tych bitów parzystości. Pożyczyłem stąd diagramy Jak działa parzystość na macierzy RAID-5

A B (A XOR B)
0 0    0
1 1    0
0 1    1
1 0    1

RAID4

Disk1   Disk2   Disk3   Disk4
----------------------------
data1  data1  data1  parity1
data2  data2  data2  parity2
data3  data3  data3  parity3
data4  data4  data4  parity4

Powiedzmy, że pierwszy rząd to:

data1 = 1
data1 = 0
data1 = 1
parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)

RAID5

Disk1   Disk2   Disk3   Disk4
----------------------------
parity1 data1   data1   data1   
data2   parity2 data2   data2  
data3   data3   parity3 data3
data4   data4   data4   parity4

Powiedzmy, że pierwszy rząd to:

parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)
data1 = 1
data1 = 0
data1 = 1

Scanarios:

1. RAID4 - AWARIA DYSKU 3:

data1 = 1
data1 = 0
data1 = 1 (COMPUTED: 1 XOR 0 XOR 0 = 1)
parity1 = 0

2. RAID4 - Disk4 (parzystość) AWARIA:

data1 = 1
data1 = 0
data1 = 1 
parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)

itp.

Ogólnie: gdy RAID (4 lub 5) używa N dysków, a jeden z nich ulega awarii. Mogę wziąć wszystkie pozostałe dyski, które nie uległy awarii (N-1) i XOR (ponieważ XOR jest operacją asocjacyjną) i otrzymam wartość błędu. Jaka jest korzyść z przechowywania parzystości nie na dedykowanym dysku, ale raczej je cyklicznie? Czy jest jakaś korzyść z wydajności lub co? Dziękuję Ci

Wakan Tanka
źródło

Odpowiedzi:

12

Różnica wydajności polega na tym, że w przypadku macierzy RAID 4 każda zmiana wymaga zapisu na dysk z pojedynczą kontrolą parzystości, co oznacza, że ​​może czekać w kolejce, aby zaktualizować dane parzystości na tym dysku.

W przypadku macierzy RAID 5 można to znacznie zmniejszyć, ponieważ obciążenie aktualizacji parzystości rozkłada się na wiele dysków, więc jest mniejsze prawdopodobieństwo utknięcia w kolejce.

Oto fajny link Fujitsu z krótkim objaśnieniem i ciekawymi animacjami, które pomogą wyjaśnić wydajność / kary RAID 4 (a także innych poziomów RAID).

Ƭᴇcʜιᴇ007
źródło
Bardzo fajna animacja. Dziękuję
Wakan Tanka
-2

OWC powiedział w swoich obudowach i przy użyciu oprogramowania SoftRaid, że RAID 4 jest szybszy do odczytu niż RAID 5. Ten sam poziom ochrony, te same prędkości zapisu, lepsze prędkości odczytu, idę z RAID 4 w mojej obudowie OWC Thunderbolt 3 z cztery napędy NVMe.

Zathras
źródło
Może tak być w przypadku OWC, ale ogólnie nie jest to prawdą z powodów podanych w odpowiedzi zx485. Dobrym pomysłem byłoby również podanie odniesienia (takiego jak link do artykułu, do którego się odwołujesz).
StarCat
Słuszna uwaga. Oto link. macperformanceguide.com/… Wyjaśnijmy, że argumentem przeciwko RAID 4 byłaby sytuacja, w której grupa użytkowników uzyskuje dostęp do danych, co może prowadzić do uzyskania dostępu do dysku parzystości, co spowalnia działanie. W sytuacji jednego użytkownika przez połączenie Thunderbolt 3 po prostu nie będzie problemu, a RAID 4 prawdopodobnie będzie szybszy.
Zathras