Odzyskiwanie RAID MDADM i pytania

0

Pracowałem nad tym przez cały dzień i chciałem rozgałęzić się i uzyskać opinie / opinie na temat tego ustawienia oraz tego, jak sobie z tym poradzić, jeśli kiedykolwiek się nie powiedzie.

Mam system Ubuntu Server, w którym system plików sam żyje na stosunkowo małym dysku, a główne przechowywane przez niego dane znajdują się na 5 dyskach skonfigurowanych w RAID5 za pomocą MDADM.

Dane przechowywane w macierzy RAID mają średni priorytet. Nie ma żadnych poufnych danych użytkownika, więc utrata nie oznaczałaby końca świata. Chciałbym jednak trochę nadmiarowości, gdy powiększam dyski, więc RAID 5 jest oczywistym wyborem.

Tak więc, jeśli dysk w tablicy ulegnie awarii, potencjalnie mogę go wymienić, zanim wydarzy się coś katastrofalnego. Jeśli inny dysk ulegnie awarii podczas wymiany pierwszego, wtedy właśnie uderzyła mnie grom pechowego oświetlenia.

Zastanawiam się, co mogę zrobić z dyskiem zawierającym system operacyjny. Teraz używam rsync do tworzenia kopii zapasowych danych w zdalnej lokalizacji raz na noc. I raz w tygodniu ta zdalna lokalizacja przetwarza system plików i przechowuje go (zawsze będzie przechowywać 4 najnowsze pliki tar). Moją logiką jest to, że powoduje to najniższy ruch między urządzeniami, co jest dobre, ponieważ serwer znajduje się w moim domu, a jednak będę mieć coś w rodzaju „pełnych” cotygodniowych kopii zapasowych na odległym końcu, a także nocną kopię zapasową. Wiersz rsync w moim skrypcie kopii zapasowej wygląda następująco:

rsync --info=progress2 --numeric-ids -aAXPve ssh /* <remote>:~/server_backup --exclude=~/Download/* --exclude=/dev/* --exclude=/proc/* --exclude=/sys/* --exclude=/tmp/* --exclude=/run/* --exclude=/mnt/* --exclude=/media/* --exclude=/lost+found --delete

W każdym razie napotkałem awarie dysków w macierzy RAID. Jest to łatwe i satysfakcjonujące, wiedząc, że wszystko, co musisz zrobić, to wymienić go, powiedzieć MDADM o wymianie dysku i poczekać dzień lub dwa, aż nowy dysk zostanie całkowicie dodany do macierzy. Jednak nie udało mi się jeszcze napotkać awarii systemu plików. Właśnie dlatego próbuję uzyskać opinie / opinie na temat tego, co powinienem zrobić.

Rozważałem dodanie kolejnego małego dysku dla systemu operacyjnego i utworzenie kopii lustrzanej dwóch przy użyciu RAID 1. Myślę, że zaletą jest to, że jeśli jeden dysk całkowicie się podłączy, drugi zapisze mój system plików. Minusem jest to, że jeśli nastąpi jakaś korupcja lub naprawdę coś zepsuję, dane są natychmiast odbijane między dwoma urządzeniami. Zasadniczo podoba mi się pomysł posiadania przyrostowych i pełnych kopii zapasowych więcej niż instalacji lustrzanej systemu plików.

Okej, ale co się dzieje w ten wierny dzień, kiedy dysk systemu plików ostatecznie zawiedzie? Idę do sklepu, kupuję nowy dysk, podłączam, a co się stanie?

Czy muszę zainstalować Ubuntu na dysku i cofnąć polecenie rsync? Co stanie się z moją partycją RAID? Jest to rodzaj ogólnego pytania, gdzie przechowywane są metadane RAID ? Czy to było na dysku systemu operacyjnego? Czy dotarło do mojego zdalnego repozytorium, które przechowuje przyrostowe kopie zapasowe za pośrednictwem rsync? Czy rezyduje wyłącznie w superbloku na dyskach RAID?

Jeśli pójdę i zdobędę nowy dysk dla systemu plików, zainstaluję Ubuntu i dodam go z powrotem na mój serwer, co zobaczy? Czy w ogóle zobaczy tablicę?

Gdybym wtedy rsync wszystkie moje zmiany z powrotem ze zdalnego serwera kopii zapasowych do mojego lokalnego serwera, to wtedy zobaczyć tablicę?

Czy też mylę się, zakładając którykolwiek z tych przypadków?

Chcę być przygotowany na śmierć dysku. Starannie wykonuję kopie zapasowe rsync poza witryną, ale chcę wiedzieć na pewno, czy to, co robię, to ogromna strata czasu i co mogę zrobić, aby zapewnić, że będę mógł nadal używać mojego systemu po katastrofalna awaria dysku, na którym znajduje się system plików.

Justyn Bell
źródło
1) jeśli nalot często się nie udaje, myślę, że powinieneś mieć nalot 10. raid 10 to lustro 2 raid5. Co do tworzenia pełnych kopii zapasowych każdej nocy może być nieco przytłaczające. kopie zapasowe należy wykonywać tylko, gdy coś się zmieni. 2) Jedynym sposobem, aby system operacyjny wyszedł z rajdu 1, jest posiadanie sprzętowego kontrolera raidu, który nie będzie działał mdadmjako kontroler raidu oprogramowania . to jest wiele pytań. Jeśli Twój system operacyjny umrze lub zostanie uszkodzony, informacje o nalocie zostaną zapisane w systemie operacyjnym. Więc instalowanie innego systemu operacyjnego nie
przyniesie żadnego skutku,
jeszcze raz zrozum, że masz do czynienia z kontrolerem RAID OPROGRAMOWANIA . Aby uniknąć utraty konfiguracji RAID w przypadku śmierci systemu operacyjnego, muszę mieć sprzętową macierz RAID. TERAZ możesz stać się trochę bardziej skomplikowany i wykonać kopię zapasową samego systemu operacyjnego na wypadek , gdyby coś poszło nie tak, wtedy możesz mieć większą szansę na utratę konfiguracji RAID.
xR34P3Rx
Nie zrozum mnie źle. Oprogramowanie RAID jest wykonalne, ale jest wiele czynności konserwacyjnych, które zostały wyjaśnione, aby upewnić się, że są niezawodne.
xR34P3Rx
Dostałem jeden dysk piętrowy, kiedy zbudowałem maszynę, i użyłem mdadm do wymiany dysku. Nie chcę już redundancji niż RAID 5. Ponadto, rsynctylko kopiuje różnice w systemie operacyjnym na maszynę zdalną, a nie pełne kopie zapasowe. Twój pierwszy komentarz odnosi się do tego, o co prosiłem: „Jeśli twój system umrze lub zostanie uszkodzony, informacje o nalocie zostaną zapisane w systemie operacyjnym. Więc zainstalowanie innego systemu operacyjnego nie przyniesie żadnego skutku, jeśli oryginalna konfiguracja RAID była na starym systemie poszło źle ”. Co noc tworzę kopię zapasową dysku systemu operacyjnego, co oznacza, że ​​jeśli zsynchronizuję go z powrotem, powinienem przywrócić konfigurację raidu, prawda?
Justyn Bell
Może nie było jasne, ale mam 6 dysków: jeden utrzymuje sam system operacyjny, nie w żadnej konfiguracji RAID, a drugi 5 jest w RAID 5. Jeśli stracę macierz z powodu wadliwych dysków, no cóż. Ale nie chcę stracić tablicy, ponieważ dysk systemu operacyjnego przestaje działać, jeśli mam kopie zapasowe.
Justyn Bell

Odpowiedzi:

0

Metadane tablic są przechowywane na każdej partycji lub dysku będącym członkiem RAID w obszarze znanym jako superblok. Prawdopodobnie chcesz zajrzeć na wiki raid, aby uzyskać więcej informacji na ten temat. np. możesz na to spojrzeć

mdadm --detail /dev/sdc1

ref https://raid.wiki.kernel.org/index.php/RAID_setup#RAID-1

ref https://raid.wiki.kernel.org/index.php/RAID_setup#The_Persistent_Superblock_.282011.29

Pod warunkiem, że używasz tradycyjnego układu RAID (tj. Bez buforowania itp.), Powinieneś być w stanie ponownie złożyć RAID5 w czystej instalacji systemu operacyjnego bez problemów.

Przypomnienie: tablice rajdowe dotyczą czasu bezawaryjnej pracy, a nie kopii zapasowych.

odnośnik http://marc.info/?l=linux-raid&m=135811522817345&w=1

Jeśli ilość danych na dysku systemu operacyjnego jest niewielka i możesz szybko zareagować, przywracanie może być wystarczająco szybkie dla twojego przypadku użycia. I możesz zachować cenną kieszeń na inne rzeczy (np. Powiększenie raid5).

Możesz nawet wstępnie utworzyć zapasowy dysk rozruchowy, aby móc wyłączyć, wymienić dysk i włączyć ponownie. Odśwież i przetestuj ten raz na kwartał lub co miesiąc, aby nie stał się zbyt przestarzały.

Jeśli chcesz przejść do rajdu1, istnieje kilka różnych sposobów, aby się tam dostać, wszystkie potrzebują jedynie odrobiny cierpliwości i okna przestoju. Poniżej podałem przykład. Istnieje wiele podobnych wyników dostępnych w szybkim google.

ref https://www.howtoforge.com/how-to-set-up-software-raid1-on-a-running-system-incl-grub2-configuration-ubuntu-10.04

Glenn
źródło
Doskonała informacja i wgląd. To jest dokładnie to, czego szukam.
Justyn Bell
Nawiasem mówiąc, jest to domowy serwer multimediów. Powodem, dla którego wybrałem RAID zamiast JBOD, jest to, że jeśli w tym drugim przypadku jeden dysk ulegnie awarii, wszystkie dane na tym dysku znikną, kropka zatrzymana. W przypadku konfiguracji RAID, jeśli dysk ulegnie awarii, statystycznie rzecz biorąc, wydaje mi się, że miałbym większą szansę na jego wymianę i nietracenie niczego. Jeśli stracę wszystko, jak wspomniałem w innym komentarzu, no cóż. To tylko media. Kopię zapasową wszystkich moich repozytoriów i danych o wysokim priorytecie wykonuję w inny sposób.
Justyn Bell
Nie mam wystarczającej liczby przedstawicieli na superużytkowniku, aby edytować moje komentarze, ale w zasadzie w systemie, w którym nie dbam o dostępność lub kopie zapasowe, wolałbym macierz RAID niż coś takiego jak JBOD.
Justyn Bell