Moja organizacja niedawno kupiła system pamięci masowej. Ma 1,5Petabajta z RAID6, a lustro synchronizowane online znajduje się w innej fizycznej lokalizacji.
System umożliwia przywracanie / odzyskiwanie plików, domyślnie pozwala to na maksymalnie 30 dni, ale można to zwiększyć.
Trwa dyskusja, czy potrzebujemy dodatkowej kopii zapasowej dla danych żyjących tylko w magazynie.
System ma bardzo dobry poziom nadmiarowości, ma nadmiarowość geograficzną i umożliwia do pewnego stopnia wycofanie, co oznacza, że możemy odzyskać do określonego czasu (domyślnie 30 dni) starych danych lub przypadkowo usuniętych danych.
Biorąc pod uwagę ten scenariusz, czy nadal ma sens posiadanie „tradycyjnej” kopii zapasowej? Przez tradycyjny rozumiem dedykowany system tworzenia kopii zapasowych z migawkami, które możemy odzyskać na wypadek, gdyby coś poszło nie tak.
Czy naprawdę tego potrzebujemy? Czy coś brakuje? Czy po prostu myślę w tradycyjny sposób i jestem zbyt gorliwy?
Odpowiedzi:
To, co opisujesz, ma zasadnicze znaczenie dla geograficznie rozproszonej macierzy RAID, a macierz RAID nigdy nie była kopią zapasową .
Synchronizacja online zazwyczaj oznacza, że wszystko, co robisz w podstawowej pamięci, jest natychmiast replikowane do systemu kopii zapasowych, w tym operacje takie jak usuwanie (wszystkich) migawek i / lub woluminów przez osobę atakującą lub po prostu błąd administratora.
źródło
30-dniowe wycofywanie jest świetną możliwością, ale co, jeśli „krytycznie ważny plik-xyz” zostanie uszkodzony / uszkodzony i nie zostanie to wykryte ponad 31 dni później? Ta sytuacja stanowi różnicę między harmonogramami tworzenia kopii zapasowych i archiwizacji, ale w twoim opisie nie wspomniano o tym drugim. Systemy archiwalne są zwykle przechowywane na bardzo tanich taśmach. Nie są również dostępne żadne informacje na temat tego, czy firma ma wymogi prawne lub inne wymagania dotyczące przechowywania danych przez okres dłuższy niż 30 dni, co często ma miejsce.
Jeśli tak nie jest w twojej sytuacji, powinieneś być dobry.
źródło
Dobrze jest mieć maszyny oddzielone geograficznie, posiadające dane.
Co się stanie, gdy wystąpi wiele awarii obejmujących obie lub wszystkie witryny? Pożar w jednym, kradzież serwerów w drugim? Czy jest problem z linią między nimi, a następnie serwer głównej lokalizacji gaśnie, a kontroler HD staje się małpą i pisze śmieci? A może jakiś informator wykonuje złośliwe działania w obu przypadkach? Lub FBI konfiskuje twoje serwery w obu lokalizacjach z powodu podejrzenia (nigdy byś nie zrobił, ale być może jesteś współ hostowany w centrum danych z Schmucks). Lub .. Przypomina mi się kilka głośnych awarii „chmury”, w których wszystko było zbędne, analizowane w stopniu n-tym, ale mimo wszystko wszystko może pójść nie tak. Przyznaję, że wszystkie są mało prawdopodobne, ale przyznałeś, że mogą się zdarzyć rzeczy mało prawdopodobne.
Wszystko sprowadza się do tego, jak ważne / cenne są te dane? Co zrobi organizacja, jeśli jej nie będzie?
źródło
Wydaje się, że pytanie dotyczy tego, jak rozłączna i geograficznie odrębna musi być replikowana kopia danych, zanim będzie to kopia zapasowa, a nie infrastruktura wysokiej dostępności / redundancji. Mam przeczucie, że jesteś blisko, ale nadal potrzebujesz kopii zapasowej.
Aby zebrać kilka myśli w innych odpowiedziach i komentarzach, możesz pójść naprawdę daleko na ścieżkę „cóż, technologia X nie obejmuje scenariusza katastrofy Y, więc nie jest to kopia zapasowa”, aw pewnym momencie musisz zdecydować, co jest dla ciebie rozsądne, i wydaje się, że właśnie dlatego pytasz. Myślę o tym i myślę, że wielu komentujących uważa, że twoja kopia zapasowa musi istnieć w oddzielnej infrastrukturze technologicznej od danych w użyciu, aby awarie, wypadki i złośliwe działania nie mogły się rozprzestrzeniać lub mieć o wiele trudniejsza do pokonania. Przykładem podanym w komentarzach jest ktoś, kto usuwa woluminy, co jest moim zdaniem poprawnym scenariuszem, który nie jest pietyzmem. Ale dodatkowo prawdziwy przykład z mojej pracy. Uniwersytet, dla którego pracuję (ale na szczęście nie t tej infrastruktury) ma poważną infrastrukturę wirtualizacji o wysokiej dostępności, która obsługuje wiele obiektów kampusu. Jest w wielu witrynach, ale wszystkie działają na platformie jednego dostawcy. Pewnego dnia pojawił się niejasny błąd, który spowodował kaskadę awarii, która najpierw zniszczyła pojedynczy serwer, a następnie, gdy obciążenie się zmieniło, usunęła resztę tej witryny, a następnie, gdy obciążenie się zmieniło, usunęła inne witryny hostujące ta infrastruktura. (Myślę, że od tego czasu rozwiązali ten problem). W tym przypadku dane nie zostały utracone, ale można sobie wyobrazić scenariusz z danymi na miejscu. Pewnego dnia pojawił się niejasny błąd, który spowodował kaskadę awarii, która najpierw zniszczyła pojedynczy serwer, a następnie, gdy obciążenie się zmieniło, usunęła resztę tej witryny, a następnie, gdy obciążenie się zmieniło, usunęła inne witryny hostujące ta infrastruktura. (Myślę, że od tego czasu rozwiązali ten problem). W tym przypadku dane nie zostały utracone, ale można sobie wyobrazić scenariusz z danymi na miejscu. Pewnego dnia pojawił się niejasny błąd, który spowodował kaskadę awarii, która najpierw zniszczyła pojedynczy serwer, a następnie, gdy obciążenie się zmieniło, usunęła resztę tej witryny, a następnie, gdy obciążenie się zmieniło, usunęła inne witryny hostujące ta infrastruktura. (Myślę, że od tego czasu rozwiązali ten problem). W tym przypadku dane nie zostały utracone, ale można sobie wyobrazić scenariusz z danymi na miejscu.
Chcesz, aby twoja kopia zapasowa była na to odporna, a nawet dostępna, gdy infrastruktura jest wyłączona. Jeśli dane są niedostępne przez tydzień, podczas gdy twoja macierz RAID się odbudowuje, przyjemne jest odzyskiwanie krytycznych dokumentów biznesowych z kopii zapasowej (choć nie jest to wymagane). Jeśli macierz RAID zniknie, a następnie powiela się na innej stronie, naprawdę chcesz, aby kopia zapasowa pochodziła od innego dostawcy lub na niektórych izolowanych nośnikach, takich jak taśma.
To powiedziawszy, jeszcze raz powtórzę, że twoja kopia zapasowa powinna znajdować się w innej infrastrukturze niż twoje dane. Istnieje tutaj wiele poziomów izolacji, ale myślę, że wszystko, co jest połączone przez bezpośrednią replikację, jest zbyt blisko, aby mogło być kopią zapasową. Będziesz chciał coś dodatkowo.
źródło
Założenie: system pamięci będzie używany przez wiele aplikacji.
Uważam, że poradzisz sobie znacznie lepiej dzięki osobnemu systemowi kopii zapasowych.
RAID i kopie lustrzane nie są kopiami zapasowymi, ale wbudowana funkcja wycofywania może zastąpić tradycyjny system tworzenia kopii zapasowych.
ALE:
Wolę zasady odzyskiwania niż aplikacje / dane, a nie pamięć, ponieważ:
źródło