Czy migawki NetApp mogą być używane jako kopie zapasowe?

11

Nasz sklep bardzo mocno korzysta z migawek woluminów NetApp do tworzenia kopii zapasowych. Używamy tradycyjnych kopii zapasowych taśm opartych na agentach dla niektórych naszych danych, ale w większości polegamy na Migawkach dla większości naszych systemów. Ponadto nie mamy rygorystycznej polityki kontroli zmian ani żadnego scentralizowanego zarządzania konfiguracją, więc wszystkonaszych serwerów, bez względu na to, czy kopie zapasowe danych dostarczanych przez ich usługi, musiałyby zostać przebudowane z czystego metalu (bez prawdziwej dokumentacji). Naturalnie sprawia to, że migawki są bardzo atrakcyjną propozycją do zarządzania, ponieważ możemy po prostu odzyskać cały serwer, dane użytkownika i konfigurację włącznie. Korzystamy z wirtualnej konsoli pamięci NetApp do tworzenia migawek naszych magazynów danych VMware opartych na NFS i SnapDrive NetApp dla surowych (fizycznych) jednostek LUN mapowanych bezpośrednio na gościach. Krytyczne migawki SnapMirror wykonujemy poza siedzibą firmy w innym filtrze. Oczywiście regularnie testujemy proces przywracania.

Nie mogę nic poradzić na to, że czuję się niekomfortowo dzięki naszemu poleganiu na migawkach na kopiach zapasowych. Dla mnie technologia, aby uznać ją za wystarczającą jako strategię tworzenia kopii zapasowych, musi spełniać następujące kryteria:

  • Kopia zapasowa musi mieć charakter atomowy. To znaczy, że kopia zapasowa nie może polegać na niczym innym do odzyskania.
  • Kopia zapasowa musi być oddzielona od systemu, dla którego jest kopią zapasową (poza pasmem).
  • Kopia zapasowa musi zostać skopiowana lub przetransportowana do strony zdalnej (poza witryną)


Migawki NetApp

Rozumiem, że Migawki NetApp działają w oparciu o metodologię przekierowania przy zapisie (RoW). Układ pliku WAFL używa zestawu wskaźników (metadanych?), Które w rzeczywistości odnoszą się do każdego bloku pamięci, gdziekolwiek by się nie znajdował. Aby wykonać migawkę, system po prostu pobiera kopię metadanych woluminu i przechowuje go w zarezerwowanym miejscu tego woluminu. Wszelkie zapisy (kreacje / zmiany / usunięcia) są przekierowywane do nowych bloków. To ma być specjalny sos, który sprawia, że ​​WAFL NetApp jest tak świetny, ponieważ nie musisz czytać, a następnie zapisywać starych danych w zarezerwowanym miejscu, a następnie zapisywać nowe dane na starych, takich jak migawki Kopiuj przy zapisie.


W pełni przyznaję, że może nie rozumiem dokładnie, jak działają Migawki woluminów NetApp, ale jeśli moje zrozumienie jest mniej więcej poprawne, Migawki NetApp nie spełniają moich kryteriów tworzenia kopii zapasowych.

  • Są to nie atomowy. „Migawka” to tak naprawdę tylko zestaw wskaźników do oryginalnych danych. Jeśli oryginalnych danych już nie ma, metadane są bezużyteczne.
  • Migawka nie jest oddzielona od systemu. Jeśli ktoś usunie niewłaściwy wolumin, stracę migawkę. Jeśli NetApp Filer eksploduje w małe małe kocięta, tracę kopię zapasową. Mogę użyć SnapMirror, aby przenieść moje migawki do innego Filera, ale znowu, to po prostu przenoszenie metadanych, a nie faktycznych bloków. Jeśli stracę oryginalny wolumin, nie widzę, w jaki sposób pomoże migawka skopiowana do innego Filera.



Czy ktoś może wyjaśnić, w jaki sposób migawki NetApp można uznać za kopie zapasowe? Szukam dobrych subiektywnych odpowiedzi, więc poprzyj swoje stanowisko faktami, referencjami i doświadczeniem. Jeśli moje rozumienie podstawowej technologii jest nieprawidłowe, proszę wyjaśnić, gdzie i dlaczego to zmienia mój wniosek. Jeśli Twój sklep korzysta z Migawek NetApp jako kopii zapasowych, dołącz wystarczającą ilość informacji kontekstowych, aby ludzie mogli dowiedzieć się, jakie zasady odzyskiwania należy spełnić.


źródło
Możesz także uzyskać przydatne informacje / najlepsze praktyki od listy dyskusyjnej administratorów toasters teaparty.net/mailman/listinfo/toasters . (Uwaga: prowadzę listę).
MadHatter
4
Mocno wierzę, że tworzenie kopii zapasowych musi odbywać się zarówno poza witryną, jak i offline. Złośliwy atakujący nie może przeprowadzić ataku elektronicznego, który usuwa taśmę z pudełka zamka. Sprawiasz, że atakujący wywołuje środki kinetyczne po przejściu do tworzenia kopii zapasowych offline.
Evan Anderson
Jak stwierdzono w samym pytaniu, już zdajesz sobie sprawę, że migawki nie są kopią danych. Dlatego potrzebny jest SnapMirror. Dlaczego więc pytasz o migawki, a nie czy migawka + SnapMirror jest prawidłowym mechanizmem tworzenia kopii zapasowych?
200_sukces
Często wykonujesz kopie zapasowe rzeczy, które nie są dublowane. Na przykład środowiska nieprodukcyjne. Odbudowywanie ich zajmuje dużo czasu, ale nie sprowadzi firmy, jeśli ją stracisz.
Basil

Odpowiedzi:

15

Kopie zapasowe pełnią dwie funkcje.

  • Przede wszystkim służą one do odzyskania danych, jeśli staną się niedostępne. W tym sensie migawki nie są kopiami zapasowymi. Jeśli stracisz dane w filerach (usunięcie woluminu, uszkodzenie pamięci, błąd oprogramowania układowego itp.), Wszystkie migawki dla tych danych również znikną.
  • Po drugie, i znacznie częściej, kopie zapasowe służą do korygowania rutynowych czynności, takich jak przypadkowe usunięcie. W tym przypadku użycia migawki kopiami zapasowymi. Są one prawdopodobnie jednym z najlepszych sposobów zapewnienia tego rodzaju odzyskiwania, ponieważ udostępniają wcześniejsze wersje danych bezpośrednio użytkownikom lub ich systemowi operacyjnemu jako ukryty katalog .snapshot, z którego mogą bezpośrednio odczytać swój plik.

Brak zasad przechowywania

To powiedziawszy, chociaż mamy migawki i intensywnie z nich korzystamy, wciąż wykonujemy nocne operacje przyrostowe na Netbackup na taśmę lub domenę danych. Powodem jest to, że migawki nie mogą niezawodnie podtrzymywać polityki przechowywania. Jeśli powiesz użytkownikom, że będą mogli tworzyć kopie zapasowe z codziennej granulacji przez tydzień, a następnie z tygodniowej granulacji przez miesiąc, nie możesz dotrzymać tej obietnicy za pomocą migawek.

Na wolumenie Netapp z migawkami usunięte dane zawarte w migawce zajmują miejsce „rezerwy przyciągania”. Jeśli wolumin nie jest pełny i skonfigurowałeś go w ten sposób, możesz również przepchnąć rezerwę migawki i mieć migawki zajmujące część nieużywanego miejsca na dane. Jeśli wolumin się zapełni, wszystkie migawki oprócz tych obsługiwanych przez dane w zarezerwowanym miejscu zostaną usunięte. Usunięcie migawek zależy tylko od dostępnej przestrzeni migawek, a jeśli będzie trzeba usunąć migawki wymagane dla zasad przechowywania, zrobi to.

Rozważ tę sytuację:

  • Pełny tom z regularnymi migawkami i wymaganiem przechowywania przez 2 tygodnie.
  • Załóż połowę rezerwy używanej na migawki w oparciu o normalną szybkość zmian.
  • Ktoś usuwa wiele danych (więcej niż rezerwa migawki), drastycznie zwiększając tymczasowo tempo zmian.

W tym momencie twoja rezerwa na migawki jest w pełni wykorzystana, podobnie jak tyle wolnego miejsca na dane, na jakie pozwoliłeś OnTap używać do migawek, ale jeszcze nie straciłeś żadnych migawek. Jednak gdy tylko ktoś zapełni wolumin kopią zapasową danymi, stracisz wszystkie migawki zawarte w sekcji danych, co spowoduje powrót punktu przywracania do czasu tuż po dużym usunięciu.

streszczenie

Migawki Netapp nie chronią przed prawdziwą utratą danych. Błędnie usunięty wolumin lub utrata danych w filtrze będzie wymagać odbudowania danych.

Są bardzo prostym i eleganckim sposobem pozwalającym na proste rutynowe przywracanie, ale nie są wystarczająco niezawodne, aby zastąpić prawdziwe rozwiązanie do tworzenia kopii zapasowych. Przez większość czasu rutynowe przywracanie będzie proste i bezbolesne, ale gdy nie będą dostępne, jesteś narażony.

Bazylia
źródło
Deletion of snapshots is determined only by available snapshot space, and if it needs to delete snapshots that are required for your retention policy- Tego nawet nie wziąłem pod uwagę. Doskonały punkt
Chcesz się zabawić? Spróbuj wykonać migawki na snapmirroredowanym woluminie dla flexclone obiektu docelowego. Następnie spróbuj użyć 100% wolnego miejsca w źródle. Działa do momentu usunięcia kopii zapasowej migawki, która jest usuwana z woluminu źródłowego, w tym momencie replikacja zostaje zatrzymana .
Basil
1
Chociaż w większości się z tobą zgadzam, prawdopodobnie poprawiłbym ci twój pierwszy punkt. Pamiętaj o regule tworzenia kopii zapasowej 3-2-1 oraz o tym, że 2 oznacza dwa różne nośniki. SnapShots fit będzie jedną z trzech kopii i być może bardziej popularnym scenariuszem przywracania. Nie są kopią twoją poza mediami ani kopią poza siedzibą. Powiedziałbym, że SnapShoty służą jako kopie zapasowe, ale nie są wystarczające jako TYLKO kopie zapasowe lub cała strategia tworzenia kopii zapasowych. Myślę, że o to ci chodziło; ale wydaje mi się, że to jest nieco bardziej dopracowane.
abegosum
Ładne rozróżnienie między dwiema (stosunkowo ważnymi) funkcjami kopii zapasowych, które można bardziej zwięźle określić odpowiednio jako odzyskiwanie po awarii i odzyskiwanie kretyn .
MadHatter
8

Są kopii zapasowej, tak. Osobiście korzystałem z nich zamiast codziennych przyrostów, ale wciąż robiliśmy cotygodniowe pełne nagrania.

Chronią one całkiem dobrze przed wszelkimi błędami i problemami użytkowników lub administratorów innymi niż netapp (systemy uzyskujące dostęp do woluminów).

Nie chronią przed katastrofalnymi awariami sprzętowymi samego netappa. Rozumiem, że SnapMirror kopiuje wszystkie dane (w migawce) do drugiego pliku [1], więc SnapMirroring do innego pliku powinien chronić ten zestaw danych przed katastrofalną awarią pojedynczego pliku.

Jednym z głównych problemów jest oczywiście to, że jeśli ktoś zarządzający netappem usunie wolumin, wówczas wszystkie migawki będą z nim związane. SnapMirror do innego pliku powinien odpowiednio przed tym chronić.

Jeśli wszystkie filtry NetApp znajdują się w tym samym centrum danych, oznacza to, że nic nie obejmuje poważnej katastrofy, tak jak by to zapewniły kopie zapasowe taśm wysyłane poza siedzibą.

Otrzymasz lepsze kopie zapasowe maszyn wirtualnych i baz danych (lub podobnych do baz danych), jeśli użyjesz odpowiedniego agenta SnapManager, który skoordynuje wyciszanie danych na krótko podczas wykonywania migawki. Jeśli dana maszyna wirtualna i jej dane są zawarte w całości w jednym woluminie NetApp, migawka tej maszyny wirtualnej powinna być spójna pod względem awarii. Oznacza to, że powinien być tak dobry, jakbyś wyciągnął wtyczkę z serwera i zobrazował dysk, co zwykle oznaczałoby sprawdzenie systemu plików i odpowiedników bazy danych. Jeśli dane bazy danych zostaną podzielone między jednostki LUN, wydaje się, że istnieje znaczne ryzyko uszkodzenia danych.

Gdybym to był ja, skonfigurowałbym wszystkie bazy danych, aby regularnie tworzyły kopie zapasowe na dysku lokalnym, i ustawiałem te zadania, aby zachowały jedną lub dwie kopie. To daje znacznie lepszą gwarancję odzysku.

[1] http://www.netapp.com/us/system/pdf-reader.aspx?m=snapmirror.pdf&cc=us

freiheit
źródło
+1 za wspomnienie SnapMirroring o innym filtrze; ludzie wydają się przeoczyć tę funkcjonalność.
MadHatter
1
Snapmirroring do innego pliku nie ochroni cię jednak przed automatycznym usunięciem migawki, skracając punkt przywracania. Jednak chroni przed usuwaniem woluminów i utratą plików.
Basil
2

Powinieneś teraz przeczytać doskonałą odpowiedź @Basil, ale oto moje dwa centy:

Migawki nie obsługują aplikacji

To, że zrobisz migawkę bazowego woluminu pamięci, nie oznacza, że ​​dane na tym woluminie można odzyskać. MS SQL jest świetnym przykładem tego - musisz upewnić się, że twoja baza danych jest spójna transakcyjnie, zanim zrobisz migawkę pamięci, której używa inaczej, ponieważ @ freiheit wspomniał, że nie jest lepiej niż odzyskiwanie po awarii. DBA uwielbiają używać różnych jednostek LUN dla różnych części SQL, aby lepiej wykorzystywać system pamięci masowej, tymczasowe bazy danych w przypadku szybkiego magazynowania, systemowe bazy danych w przypadku wolniejszego przechowywania, dane tylko do odczytu lub dane archiwalne w magazynie masowym oraz dane robocze gdzieś pomiędzy nimi. Jeśli tworzysz migawki tych woluminów, jest bardzo mało prawdopodobne, że będziesz w stanie odzyskać bazę danych.

NetApp dostarcza szereg narzędzi Snap, aby uświadomić aplikację migawek. SnapManager dla SQL zapewnia tę świadomość. W ekosystemie Microsoft uważam, że istnieją również narzędzia SnapManager dla Exchange i SharePoint. SnapDrive nie ma tej świadomości aplikacji. To po prostu wygodna metoda zarządzania pamięcią w gościu.

Jeśli przechowujesz wszystkie dane i konfigurację usług IIS w jednostkach LUN i bezpośrednio wykonujesz migawkę tych jednostek LUN, nie możesz zagwarantować, że dane można odzyskać. Zapytaj mnie, skąd wiem ...


Wiele typów pamięci masowej może mieć różne harmonogramy migawek

Jeśli prezentujesz pamięć masową swoim serwerom na różne sposoby, może to skomplikować twoją migawkę i obraz odzyskiwania. NetApp ONTAP jest ofertą wieloprotokołową i jest bardzo możliwe, że używasz więcej niż jednej metody lub typu pamięci dla konkretnego serwera. W naszym sklepie niektórzy z naszych serwerów dostają dysk C: \ przez magazyn danych oparty na NFS, a ich dyski „Storage” przez jednostki LUN Raw Mapped. Robiliśmy migawki jednostek LUN RDM, ale nie magazynów danych opartych na NFS. Utrudniało to odzyskanie serwera .


Migawki nie mają gwarantowanej zasady przechowywania

Znów @Basil naprawdę dobrze to opisuje, ale warto to powtórzyć. Możliwe jest wypełnienie Snap Reserve w taki sposób, że Snpashot Autodelete usuwa migawki, które nie uległy naturalnemu starzeniu do usunięcia. Jeszcze raz. Może to być naprawdę złe, jeśli Ty lub Twoi klienci oczekują, że będą dostępne trzy tygodnie migawek.


Migawki są wbudowane

Jest to wada zintegrowanego magazynu ... jest dobrze ... zintegrowany. Twoje migawki znajdują się na tej samej platformie, na której tworzona jest kopia zapasowa. Jeśli wolumin lub filtr, w którym jest włączony, zniknie, kopia zapasowa również. Możesz to nieco złagodzić, kopiując migawki do innego Filera za pomocą SnapMirror, jak błędnie stwierdziłem w moim pytaniu, że kopia SnapMirror nie jest pełną kopią.


Migawki umożliwiają kontynuowanie złych praktyk operacyjnych

Zauważyłem jedną rzecz: migawki umożliwiają menedżerom i klientom kontynuowanie okropnych operacji. W naszym środowisku mamy bardzo słabe praktyki zarządzania dokumentacją i konfiguracją. Oznacza to, że większość serwerów zaczyna się od tej samej bazy (szablonu lub obrazu), ale następnie są konfigurowane ręcznie przez różne grupy osób. W miarę kontynuowania życia serwery coraz bardziej odbiegają od szablonu w sposób, który zasadniczo nie jest dokumentowany ani wdrażany za pomocą zarządzania konfiguracją.

A potem nadchodzą migawki! Nie musimy cofać się i zająć niektórymi z naszych podstawowych praktyk operacyjnych, ponieważ możemy po prostu wykonać migawkę wszystkich naszych serwerów! I możemy użyć SnapMirror, aby przenieść te migawki poza witrynę, abyśmy mogli wykorzystać je jako kopie zapasowe!

Myślę, że to niewłaściwa lekcja do nauki tutaj. Lepszą lekcją do nauczenia jest to, że kopia zapasowa struktury zarządzania konfiguracją, nawet jeśli jest tak prosta jak dziennik zmian, powinna być tworzona na potrzeby przywracania systemu od zera. Migawki są fantastycznym narzędziem, ale mogę pokusić się o zbytnią zależność od nich w celu odstraszania ważnych podstaw.

Społeczność
źródło