Dlaczego RAID nie jest kopią zapasową?

112

Gdy ktoś wspomina o macierzy RAID w rozmowie na temat kopii zapasowych, niezmiennie ktoś deklaruje, że „RAID nie jest kopią zapasową”.

Jasne, do rozbierania to prawda. Ale jaka jest różnica między redundancją a kopią zapasową?

jldugger
źródło

Odpowiedzi:

131

RAID chroni przed jednym rodzajem awarii sprzętu. Istnieje wiele trybów awarii, przed którymi się nie chroni.

  • Uszkodzenie pliku
  • Błąd ludzki (przypadkowe usuwanie plików)
  • Katastrofalne uszkodzenia (ktoś zrzuca wodę na serwer)
  • Wirusy i inne złośliwe oprogramowanie
  • Błędy oprogramowania, które usuwają dane
  • Problemy sprzętowe, które usuwają dane lub powodują uszkodzenie sprzętu (awarie kontrolera, błędy oprogramowania układowego, skoki napięcia, ...)

i więcej.

Kevin Dente
źródło
2
Czy kopia zapasowa odmówi skopiowania uszkodzonego pliku?
jldugger
15
Zależy od tego, co oznacza „uszkodzony”, ale zwykle aplikacje do tworzenia kopii zapasowych mają do tego odpowiednie ustawienie ... jednak drugim punktem kopii zapasowej jest przechowywanie różnych wersji pliku przez cały czas - nie tylko jednej wersji - w ten sposób omijając problem z nową uszkodzony plik zastępujący świeżą wersję ...
Oskar Duveborn
2
> Czy kopia zapasowa odmówi skopiowania uszkodzonego pliku Tak, jeśli nie możesz odczytać bloków uszkodzonego pliku, nie będziesz w stanie wykonać jego kopii (kopii zapasowej)
Dave Cheney
1
Ale co z cichym uszkodzeniem danych; jeśli blok danych ulegnie awarii, większość systemów plików nie zauważy tego, prawda?
jldugger
11
Rozsądne strategie tworzenia kopii zapasowych obejmują prowadzenie historii, abyś mógł wrócić do niej przed zniszczeniem. Najczęstszym sposobem postępowania z możliwością wystąpienia korupcji jest udawanie, że to nie może się zdarzyć. Ale jeśli chcesz się przed nim zabezpieczyć, możesz spróbować wykryć go jak najszybciej i przy różnych rozmiarach porcji (poziom bloku urządzenia, poziom strony bazy danych, poziom pliku). Jeśli wykryjesz uszkodzenie danych wystarczająco szybko, nie jest to już „ciche” uszkodzenie danych i masz szansę na odzyskanie.
carlito
106

P: Dlaczego RAID nie jest kopią zapasową?

Odp .: Ponieważ głównym celem RAID jest upewnienie się, że nic na świecie nie może przerwać tego przypadkowego rm -rf /(lub DELTREE /X C:\), nawet nie szarpiąc struny mocy w panice.

P: Ale jaka jest różnica między redundancją a kopią zapasową?

Odp .: Jeśli przypadkowo zastąpisz swoją rozprawę doktorską śmieciami, nadmiarowość zapewnia, że ​​masz wiele kopii śmieci, na wypadek, gdyby ktoś się zepsuł. Kopia zapasowa zapewnia, że ​​możesz przywrócić pracę doktorską.

(A archiwum zapewnia, że ​​możesz pobrać wiele starszych wersji swojej pracy, a system kontroli wersji informuje również, dlaczego stworzyłeś nową wersję.)

Jörg W Mittag
źródło
29

Redundancja chroni przed awarią sprzętu. Nie chroni przed błędami użytkownika ani przed złośliwą aktywnością (np. Włamywaczami do twojego systemu).

Zobacz: Dlaczego tworzenie kopii lustrzanych nie jest rozwiązaniem do tworzenia kopii zapasowych ciężko zdobytej lekcji.

Chris Jester-Young
źródło
7
Ani błędów oprogramowania, które są bardziej powszechne niż złośliwe działania.
jhs
To interesująca ironia, że ​​artykuł z tej strony Slashdot zniknął z sieci. Nawet archiwum internetowe nie zawiera sensownej kopii; mimo że zaindeksowali stronę wkrótce po dacie artykułu Slashdot, ich kopia po prostu mówi, że strona nie została znaleziona.
CVn
Ani błędów pamięci, dlatego potrzebujesz ECC.
inf3rno
19

Głównym powodem, dla którego chcesz utworzyć kopię zapasową, nie jest to, że fizyczny nośnik zmarł (jest to rzadki przypadek), ale z powodu błędu, który spowodował utratę lub uszkodzenie danych.

RAID nie chroni Cię przed usunięciem pliku.

RAID nie chroni Cię przed nadpisaniem pliku.

RAID nie chroni cię przed naruszeniem systemu i nadpisaniem, usunięciem lub uszkodzeniem wszystkich danych.

RAID nie chroni cię przed zespołem operacyjnym przypadkowo układającym maszynę z ważnymi danymi na jej temat.

RAID nie chroni cię przed niemądrym DBA uruchamiającym polecenie drop na serwerze produkcyjnym (myląc go ze środowiskiem testowym).

RAID nie chroni cię, jeśli budynek spłonie.

PS http://ma.gnolia.com/ . To może się zdarzyć, jeśli nie masz dobrych kopii zapasowych. Twoja witryna została wykreślona z istnienia (uwaga: może to być złe dla biznesu).

Klin
źródło
1
Musisz więc zbudować kolejny budynek tylko na potrzeby tworzenia kopii zapasowych. Trolololo. : D
inf3rno
1
@ inf3rno okazuje się, że inni zbudowali już wiele innych budynków.
Wedge
1
Nie sądzę, żeby http://ma.gnolia.com/to było to, co chciałeś połączyć z ...
CVn
10

Nadmiarowość jest świetna, jeśli jeden z dysków ulegnie awarii. Nie jest tak wspaniale, jeśli komputer zostanie zainfekowany wirusem lub przypadkowo usuniesz plik, lub musisz przywrócić dysk do poprzedniej wersji z innego powodu. Wtedy potrzebujesz kopii zapasowej.

RAID pomaga odzyskać po awarii, ale kopie zapasowe pozwalają cofnąć się w czasie.

Chris Upchurch
źródło
8

Należy również wspomnieć, że błąd sprzętowy kontrolera RAID może łatwo uszkodzić dane na wszystkich dołączonych dyskach. Podczas gdy zmniejszasz ryzyko awarii dysku, dodajesz niebezpieczeństwo awarii kontrolera RAID.

coś
źródło
6

RAID może być świetnym sposobem na ograniczenie ryzyka związanego z awariami sprzętu, ale RAID nie pomoże, gdy użytkownicy usuwają (przypadkowo lub w inny sposób) swoje dane. Aby odzyskać dane, potrzebujesz niektórych funkcji archiwizacji, albo poprzez lokalne migawki, albo kopie zapasowe online / offline.

tvanfosson
źródło
6
  • Wiele obrotowych kopii
  • Redundancja geograficzna

W komentarzu do zaakceptowanego pytania zadano:

Czy kopia zapasowa odmówi skopiowania uszkodzonego pliku?

Nawet jeśli kopia zapasowa kopiuje uszkodzone lub złe dane, chodzi o to, że możesz i powinieneś mieć wiele kopii. Na przykład ostatnia godzina, wczoraj, ostatni tydzień itp. Możesz uzyskać podobny efekt, stosując rotacyjne migawki na urządzeniu pamięci masowej.

Ale drugim powodem tworzenia kopii zapasowych jest redundancja geograficzna. Z pewnością powinieneś przechowywać kopie krytycznych danych w dwóch różnych lokalizacjach geograficznych. To, jak osobne są te lokalizacje, zależy od tego, jak ważne są dane; przechowywanie kopii w dwóch różnych budynkach w tym samym mieście chroni przed pożarem lub kradzieżą. Przechowywanie kopii w dwóch różnych krajach chroni przed większymi problemami.

Jared Oberhaus
źródło
+1 za wartość nierówności geograficznej.
killermist
Świetna odpowiedź, ale naprawdę chciałbym głębiej zagłębić się w „większy” problem :) Co dokładnie są sklasyfikowane jako problemy
Teo Carter
3

W macierzy RAID5, składającej się z dysków o pojemności przekraczającej 400 Gb, w przypadku zgubienia dysku istnieje 75% szansa na wystąpienie nieodwracalnego błędu odczytu podczas odbudowywania macierzy . Pomyśl o tym przez chwilę, a stanie się dość oczywiste, dlaczego ktoś zawsze będzie ci przypominał, że „RAID nie jest kopią zapasową”.

RAID zapewnia wyższą niezawodność i wydajność, ale nie jest nieomylny.

saschabeaumont
źródło
3
Prawdziwy problem, zła matematyka.
Paweł Brodacki
3

Jaka jest różnica między redundancją a kopią zapasową? Ok, skonfiguruj zestaw dysków RAID 5. Przechowuj na nim niektóre kluczowe dla firmy rzeczy. Wyciągnij dysk. Wszystko nadal działa! To jest redundancja. Teraz usuń wszystkie dane (nie oszukiwaj za pomocą kosza). Teraz przywróć go z najnowszej kopii zapasowej. Nie masz? Ups Przynajmniej możesz powiedzieć swojemu szefowi, że twoje dyski korzystają z nadmiarowości RAID 5 (kiedy maszerujesz z budynku ...)

PowerApp101
źródło
1

Pożar, kradzież, awaria kontrolera RAID, błąd ludzki, lista jest długa

Quog
źródło
1

Weź również pod uwagę, że masz wiele dysków twardych, które prawdopodobnie zostały zbudowane w tym samym czasie, a następnie były narażone na te same warunki przez lata ... jakie są szanse, że wszystkie one zawiodą w tym samym czasie ... całkiem wysokie

trent
źródło
3
MTBF! = Oczekiwana żywotność sprzętu
Tetsujin no Oni
Jednak tak naprawdę nie jest to problem z macierzą RAID . Cóż, „te same wzorce użytkowania” mogą być zaostrzone przez RAID, ale wiele dysków narażonych na te same warunki nie jest funkcją RAID.
CVn