Nasz sklep bardzo mocno korzysta z migawek woluminów NetApp do tworzenia kopii zapasowych. Używamy tradycyjnych kopii zapasowych taśm opartych na agentach dla niektórych naszych danych, ale w większości polegamy na Migawkach dla większości naszych systemów. Ponadto nie mamy rygorystycznej polityki kontroli zmian ani żadnego scentralizowanego zarządzania konfiguracją, więc wszystkonaszych serwerów, bez względu na to, czy kopie zapasowe danych dostarczanych przez ich usługi, musiałyby zostać przebudowane z czystego metalu (bez prawdziwej dokumentacji). Naturalnie sprawia to, że migawki są bardzo atrakcyjną propozycją do zarządzania, ponieważ możemy po prostu odzyskać cały serwer, dane użytkownika i konfigurację włącznie. Korzystamy z wirtualnej konsoli pamięci NetApp do tworzenia migawek naszych magazynów danych VMware opartych na NFS i SnapDrive NetApp dla surowych (fizycznych) jednostek LUN mapowanych bezpośrednio na gościach. Krytyczne migawki SnapMirror wykonujemy poza siedzibą firmy w innym filtrze. Oczywiście regularnie testujemy proces przywracania.
Nie mogę nic poradzić na to, że czuję się niekomfortowo dzięki naszemu poleganiu na migawkach na kopiach zapasowych. Dla mnie technologia, aby uznać ją za wystarczającą jako strategię tworzenia kopii zapasowych, musi spełniać następujące kryteria:
- Kopia zapasowa musi mieć charakter atomowy. To znaczy, że kopia zapasowa nie może polegać na niczym innym do odzyskania.
- Kopia zapasowa musi być oddzielona od systemu, dla którego jest kopią zapasową (poza pasmem).
- Kopia zapasowa musi zostać skopiowana lub przetransportowana do strony zdalnej (poza witryną)
Rozumiem, że Migawki NetApp działają w oparciu o metodologię przekierowania przy zapisie (RoW). Układ pliku WAFL używa zestawu wskaźników (metadanych?), Które w rzeczywistości odnoszą się do każdego bloku pamięci, gdziekolwiek by się nie znajdował. Aby wykonać migawkę, system po prostu pobiera kopię metadanych woluminu i przechowuje go w zarezerwowanym miejscu tego woluminu. Wszelkie zapisy (kreacje / zmiany / usunięcia) są przekierowywane do nowych bloków. To ma być specjalny sos, który sprawia, że WAFL NetApp jest tak świetny, ponieważ nie musisz czytać, a następnie zapisywać starych danych w zarezerwowanym miejscu, a następnie zapisywać nowe dane na starych, takich jak migawki Kopiuj przy zapisie.
W pełni przyznaję, że może nie rozumiem dokładnie, jak działają Migawki woluminów NetApp, ale jeśli moje zrozumienie jest mniej więcej poprawne, Migawki NetApp nie spełniają moich kryteriów tworzenia kopii zapasowych.
- Są to nie atomowy. „Migawka” to tak naprawdę tylko zestaw wskaźników do oryginalnych danych. Jeśli oryginalnych danych już nie ma, metadane są bezużyteczne.
- Migawka nie jest oddzielona od systemu. Jeśli ktoś usunie niewłaściwy wolumin, stracę migawkę. Jeśli NetApp Filer eksploduje w małe małe kocięta, tracę kopię zapasową. Mogę użyć SnapMirror, aby przenieść moje migawki do innego Filera, ale znowu, to po prostu przenoszenie metadanych, a nie faktycznych bloków. Jeśli stracę oryginalny wolumin, nie widzę, w jaki sposób pomoże migawka skopiowana do innego Filera.
Czy ktoś może wyjaśnić, w jaki sposób migawki NetApp można uznać za kopie zapasowe? Szukam dobrych subiektywnych odpowiedzi, więc poprzyj swoje stanowisko faktami, referencjami i doświadczeniem. Jeśli moje rozumienie podstawowej technologii jest nieprawidłowe, proszę wyjaśnić, gdzie i dlaczego to zmienia mój wniosek. Jeśli Twój sklep korzysta z Migawek NetApp jako kopii zapasowych, dołącz wystarczającą ilość informacji kontekstowych, aby ludzie mogli dowiedzieć się, jakie zasady odzyskiwania należy spełnić.
Odpowiedzi:
Kopie zapasowe pełnią dwie funkcje.
Brak zasad przechowywania
To powiedziawszy, chociaż mamy migawki i intensywnie z nich korzystamy, wciąż wykonujemy nocne operacje przyrostowe na Netbackup na taśmę lub domenę danych. Powodem jest to, że migawki nie mogą niezawodnie podtrzymywać polityki przechowywania. Jeśli powiesz użytkownikom, że będą mogli tworzyć kopie zapasowe z codziennej granulacji przez tydzień, a następnie z tygodniowej granulacji przez miesiąc, nie możesz dotrzymać tej obietnicy za pomocą migawek.
Na wolumenie Netapp z migawkami usunięte dane zawarte w migawce zajmują miejsce „rezerwy przyciągania”. Jeśli wolumin nie jest pełny i skonfigurowałeś go w ten sposób, możesz również przepchnąć rezerwę migawki i mieć migawki zajmujące część nieużywanego miejsca na dane. Jeśli wolumin się zapełni, wszystkie migawki oprócz tych obsługiwanych przez dane w zarezerwowanym miejscu zostaną usunięte. Usunięcie migawek zależy tylko od dostępnej przestrzeni migawek, a jeśli będzie trzeba usunąć migawki wymagane dla zasad przechowywania, zrobi to.
Rozważ tę sytuację:
W tym momencie twoja rezerwa na migawki jest w pełni wykorzystana, podobnie jak tyle wolnego miejsca na dane, na jakie pozwoliłeś OnTap używać do migawek, ale jeszcze nie straciłeś żadnych migawek. Jednak gdy tylko ktoś zapełni wolumin kopią zapasową danymi, stracisz wszystkie migawki zawarte w sekcji danych, co spowoduje powrót punktu przywracania do czasu tuż po dużym usunięciu.
streszczenie
Migawki Netapp nie chronią przed prawdziwą utratą danych. Błędnie usunięty wolumin lub utrata danych w filtrze będzie wymagać odbudowania danych.
Są bardzo prostym i eleganckim sposobem pozwalającym na proste rutynowe przywracanie, ale nie są wystarczająco niezawodne, aby zastąpić prawdziwe rozwiązanie do tworzenia kopii zapasowych. Przez większość czasu rutynowe przywracanie będzie proste i bezbolesne, ale gdy nie będą dostępne, jesteś narażony.
źródło
Deletion of snapshots is determined only by available snapshot space, and if it needs to delete snapshots that are required for your retention policy
- Tego nawet nie wziąłem pod uwagę. Doskonały punktSą kopii zapasowej, tak. Osobiście korzystałem z nich zamiast codziennych przyrostów, ale wciąż robiliśmy cotygodniowe pełne nagrania.
Chronią one całkiem dobrze przed wszelkimi błędami i problemami użytkowników lub administratorów innymi niż netapp (systemy uzyskujące dostęp do woluminów).
Nie chronią przed katastrofalnymi awariami sprzętowymi samego netappa. Rozumiem, że SnapMirror kopiuje wszystkie dane (w migawce) do drugiego pliku [1], więc SnapMirroring do innego pliku powinien chronić ten zestaw danych przed katastrofalną awarią pojedynczego pliku.
Jednym z głównych problemów jest oczywiście to, że jeśli ktoś zarządzający netappem usunie wolumin, wówczas wszystkie migawki będą z nim związane. SnapMirror do innego pliku powinien odpowiednio przed tym chronić.
Jeśli wszystkie filtry NetApp znajdują się w tym samym centrum danych, oznacza to, że nic nie obejmuje poważnej katastrofy, tak jak by to zapewniły kopie zapasowe taśm wysyłane poza siedzibą.
Otrzymasz lepsze kopie zapasowe maszyn wirtualnych i baz danych (lub podobnych do baz danych), jeśli użyjesz odpowiedniego agenta SnapManager, który skoordynuje wyciszanie danych na krótko podczas wykonywania migawki. Jeśli dana maszyna wirtualna i jej dane są zawarte w całości w jednym woluminie NetApp, migawka tej maszyny wirtualnej powinna być spójna pod względem awarii. Oznacza to, że powinien być tak dobry, jakbyś wyciągnął wtyczkę z serwera i zobrazował dysk, co zwykle oznaczałoby sprawdzenie systemu plików i odpowiedników bazy danych. Jeśli dane bazy danych zostaną podzielone między jednostki LUN, wydaje się, że istnieje znaczne ryzyko uszkodzenia danych.
Gdybym to był ja, skonfigurowałbym wszystkie bazy danych, aby regularnie tworzyły kopie zapasowe na dysku lokalnym, i ustawiałem te zadania, aby zachowały jedną lub dwie kopie. To daje znacznie lepszą gwarancję odzysku.
[1] http://www.netapp.com/us/system/pdf-reader.aspx?m=snapmirror.pdf&cc=us
źródło
Powinieneś teraz przeczytać doskonałą odpowiedź @Basil, ale oto moje dwa centy:
Migawki nie obsługują aplikacji
To, że zrobisz migawkę bazowego woluminu pamięci, nie oznacza, że dane na tym woluminie można odzyskać. MS SQL jest świetnym przykładem tego - musisz upewnić się, że twoja baza danych jest spójna transakcyjnie, zanim zrobisz migawkę pamięci, której używa inaczej, ponieważ @ freiheit wspomniał, że nie jest lepiej niż odzyskiwanie po awarii. DBA uwielbiają używać różnych jednostek LUN dla różnych części SQL, aby lepiej wykorzystywać system pamięci masowej, tymczasowe bazy danych w przypadku szybkiego magazynowania, systemowe bazy danych w przypadku wolniejszego przechowywania, dane tylko do odczytu lub dane archiwalne w magazynie masowym oraz dane robocze gdzieś pomiędzy nimi. Jeśli tworzysz migawki tych woluminów, jest bardzo mało prawdopodobne, że będziesz w stanie odzyskać bazę danych.
NetApp dostarcza szereg narzędzi Snap, aby uświadomić aplikację migawek. SnapManager dla SQL zapewnia tę świadomość. W ekosystemie Microsoft uważam, że istnieją również narzędzia SnapManager dla Exchange i SharePoint. SnapDrive nie ma tej świadomości aplikacji. To po prostu wygodna metoda zarządzania pamięcią w gościu.
Jeśli przechowujesz wszystkie dane i konfigurację usług IIS w jednostkach LUN i bezpośrednio wykonujesz migawkę tych jednostek LUN, nie możesz zagwarantować, że dane można odzyskać. Zapytaj mnie, skąd wiem ...
Wiele typów pamięci masowej może mieć różne harmonogramy migawek
Jeśli prezentujesz pamięć masową swoim serwerom na różne sposoby, może to skomplikować twoją migawkę i obraz odzyskiwania. NetApp ONTAP jest ofertą wieloprotokołową i jest bardzo możliwe, że używasz więcej niż jednej metody lub typu pamięci dla konkretnego serwera. W naszym sklepie niektórzy z naszych serwerów dostają dysk C: \ przez magazyn danych oparty na NFS, a ich dyski „Storage” przez jednostki LUN Raw Mapped. Robiliśmy migawki jednostek LUN RDM, ale nie magazynów danych opartych na NFS. Utrudniało to odzyskanie serwera .
Migawki nie mają gwarantowanej zasady przechowywania
Znów @Basil naprawdę dobrze to opisuje, ale warto to powtórzyć. Możliwe jest wypełnienie Snap Reserve w taki sposób, że Snpashot Autodelete usuwa migawki, które nie uległy naturalnemu starzeniu do usunięcia. Jeszcze raz. Może to być naprawdę złe, jeśli Ty lub Twoi klienci oczekują, że będą dostępne trzy tygodnie migawek.
Migawki są wbudowane
Jest to wada zintegrowanego magazynu ... jest dobrze ... zintegrowany. Twoje migawki znajdują się na tej samej platformie, na której tworzona jest kopia zapasowa. Jeśli wolumin lub filtr, w którym jest włączony, zniknie, kopia zapasowa również. Możesz to nieco złagodzić, kopiując migawki do innego Filera za pomocą SnapMirror, jak błędnie stwierdziłem w moim pytaniu, że kopia SnapMirror nie jest pełną kopią.
Migawki umożliwiają kontynuowanie złych praktyk operacyjnych
Zauważyłem jedną rzecz: migawki umożliwiają menedżerom i klientom kontynuowanie okropnych operacji. W naszym środowisku mamy bardzo słabe praktyki zarządzania dokumentacją i konfiguracją. Oznacza to, że większość serwerów zaczyna się od tej samej bazy (szablonu lub obrazu), ale następnie są konfigurowane ręcznie przez różne grupy osób. W miarę kontynuowania życia serwery coraz bardziej odbiegają od szablonu w sposób, który zasadniczo nie jest dokumentowany ani wdrażany za pomocą zarządzania konfiguracją.
A potem nadchodzą migawki! Nie musimy cofać się i zająć niektórymi z naszych podstawowych praktyk operacyjnych, ponieważ możemy po prostu wykonać migawkę wszystkich naszych serwerów! I możemy użyć SnapMirror, aby przenieść te migawki poza witrynę, abyśmy mogli wykorzystać je jako kopie zapasowe!
Myślę, że to niewłaściwa lekcja do nauki tutaj. Lepszą lekcją do nauczenia jest to, że kopia zapasowa struktury zarządzania konfiguracją, nawet jeśli jest tak prosta jak dziennik zmian, powinna być tworzona na potrzeby przywracania systemu od zera. Migawki są fantastycznym narzędziem, ale mogę pokusić się o zbytnią zależność od nich w celu odstraszania ważnych podstaw.
źródło