Co się stanie, gdy dysk ulegnie awarii w LVM?

11

Konfiguruję serwer Linux na hoście ESX 4.1. Na tym serwerze musi znajdować się kilka TB danych. Obecnie debatujemy, czy użyć LVM. Nasze obecne rozumowanie jest takie, że najlepiej jest mieć wiele woluminów 2 TB (limit narzucony przez ESX) zamontowanych na osobnych woluminach jako takich.

/disk1 - 2TB

/disk2 - 2TB

/disk3 - 2TB

Będziemy przechowywać katalogi o rozmiarach od 100 GB do 400 GB. Te katalogi muszą być przechowywane w całości i nie można ich podzielić. Problem polega na tym, że będzie dużo zmarnowanego miejsca, jeśli w końcu będziemy mieć 1,7 TB zapisanych na / disk1 i będziemy musieli przechowywać dodatkowe 400 GB. W takim przypadku musielibyśmy przechowywać katalog 400 GB na / disk2, pozostawiając 300 GB niewykorzystane.

Jednym z rozwiązań tego problemu jest LVM, skonfigurowany jako:

 --------
 Disk 1 | 
        |
 Disk 2 |---->/disk
        | 
 Disk 3 | 
 --------

Utknęliśmy jednak na jednym prostym pytaniu. Co się stanie, jeśli dysk 2 ulegnie awarii?

W pierwszym scenariuszu jest oczywiste, co się stanie, jeśli Dysk 2 ulegnie awarii, / dysk2 nie będzie już dostępny.

Czy w przypadku konfiguracji LVM awaria dysku 2 byłaby podobna (jak w przypadku, gdy dane przechowywane na dysku 2 nie są już dostępne), czy też wszystkie dane na dysku nie byłyby już dostępne?

Gulasz
źródło
1
Jeśli używasz ESXi v5, możesz użyć> 2 TB RDM, aby obejść ten problem - to właśnie robię.
Chopper3

Odpowiedzi:

7

Pominąłeś wiele ważnych pojęć abstrakcyjnych, które pochodzą z LVM. Woluminy logiczne nie obsługują dysków - są umieszczane w grupach woluminów. VG z kolei składają się z fizycznych woluminów, które mogą być dyskami. Krótko mówiąc, VG nie znalazłby brakującego PV - tj. Brakującego dysku, więc nie byłbyś w stanie uzyskać dostępu do woluminów logicznych w grupie.

Istnieją procedury odzyskiwania , ale zwykle w środowisku zwirtualizowanym i tak widać dostępność „wszystko albo nic” - wszystkie pliki dyskowe byłyby zawarte w jednym katalogu, który jest dostępny z całą zawartością lub wcale (jeśli magazyn danych nie jest dostępny na przykład).

Jeśli chodzi o wydajność pamięci masowej, rozważ użycie cienkiego udostępniania - w magazynie danych nie jest zgłaszane „nieużywane” miejsce. Jednak wiąże się to z wyższymi kosztami administracyjnymi.

the-wabbit
źródło
Cóż, to odpowiada na podstawowe pytanie, że dostępność LVM to wszystko albo nic. Wcześniej korzystałem z LVM, ale (na szczęście) nigdy nie przeszedłem procedur odzyskiwania. Jeśli chodzi o cienkie przydzielanie, to nie jest tak naprawdę rozwiązanie. Mamy zestaw jednostek LUN (2 TB każdy), które są dedykowane dla tego serwera. Nawet jeśli mamy cienkie przydzielanie, to tak naprawdę nie rozwiązuje problemu danych, które muszą obejmować wiele woluminów 2 TB. Wygląda na to, że jedyne dwie opcje to albo uaktualnienie do ESXi 5 (które i tak było w planach), albo życie z odrobiną zmarnowanego miejsca. Dziękuję za odpowiedź.
Gulasz
2
dlaczego masz zestaw 2 TB jednostek LUN zamiast jednej jednostki LUN w większym magazynie danych VMFS, w którym tworzysz trzy dyski wirtualne? Limit 2 TB dotyczy tylko dysków wirtualnych , a nie rozmiaru samego magazynu danych.
the-wabbit
Jak to działa? Miałem wiele problemów (bardzo tajemnicze błędy) podczas próby zamontowania jednostki LUN większej niż 2 TB. Ponadto wtyczka equallogic dla vmware ma limit 2 TB dla rozmiaru LUN (choć ten limit nie jest egzekwowany przy tworzeniu LUN przez interfejs WWW). Czy poza dużym ułatwieniem zarządzania istnieje duża zaleta posiadania dużego magazynu danych?
Gulasz
Musisz pracować z „zakresami VMFS” - utwórz VMFS o wielkości 2 TB, po utworzeniu rozszerz go o 2 TB. Możesz mieć do 32 zakresów, co daje łączny górny limit 64 TB na VMFS. Nie znam wtyczki equallogic, więc nie mogę powiedzieć nic o jej ograniczeniach. Moim zdaniem wirtualizacja polega na „łatwiejszym zarządzaniu”, więc nie powinno być żadnej innej korzyści :) BTW, możesz również rozważyć umożliwienie wirtualnemu hostowi bezpośredniego dostępu do pamięci LUN pamięci - łatwe, jeśli masz iSCSI, nie całkiem tak łatwo z Fibre Channel.
the-wabbit
Myślałem o użyciu surowych mapowań urządzeń, wydawało mi się to dobrym rozwiązaniem, ale tak naprawdę nie miałem pojęcia o zakresach VMFS. Natychmiast przejdę do badań. Dzięki za aktualizację, to świetna informacja!
Gulasz