Co to jest sieć pamięci masowej i jakie ma zalety w stosunku do różnych rozwiązań pamięci masowej?

35

Proponuję, aby było to kanoniczne pytanie o sieci pamięci masowej na poziomie przedsiębiorstwa.

Co to jest sieć pamięci masowej (SAN) i jak działa?
Czym różni się od Network Attached Storage (NAS)?
Jakie są przypadki użycia w porównaniu do bezpośredniego przechowywania danych (DAS)?
W jaki sposób jest to lepsze czy gorsze?
Dlaczego to jest takie drogie?
Czy powinienem (lub moja firma) skorzystać z jednego?

Massimo
źródło
@Basil: czy uważasz, że pytanie powinno dotyczyć także NAS? Są to zasadniczo różne rzeczy od SAN (i już istnieje pytanie, które je porównuje: serverfault.com/questions/81723/… ). Chciałem, żeby ten dotyczył w szczególności sieci SAN. Nie usuwam Twojej edycji, ale doceniłbym opinię społeczności na ten temat.
Massimo,
Udostępnianie plików jest zazwyczaj funkcją większości urządzeń pamięci masowej dostępnych obecnie na rynku, ponieważ większość ludzi nazywa je „SAN”.
Basil
Myślę, że pytanie, które połączyłem, obejmuje to całkiem dobrze, a także NAS są koncepcyjnie znacznie prostsze (są to w zasadzie serwery plików). Sieć SAN jest znacznie bardziej złożona, modułowa i droższa. Rozszerzenie zakresu tego pytania na wszystkie formy przechowywania sprawiłoby, że byłoby ono zbyt szerokie. To oczywiście moja opinia.
Massimo,
Chodzi mi o to, że każde rozwiązanie do przechowywania, które można teraz uzyskać, ma zintegrowane serwowanie plików. EMC, HDS, IBM, HP, Netapp (oczywiście), Dell. Nie można mówić o „sieci SAN” (ponownie, mylnej nazwie, ponieważ tak właśnie określa się ją jako warstwę łączności) bez mówienia o udostępnianiu plików. Czy mógłbyś wskoczyć do pokoju komunikacji?
Basil
1
Podoba mi się sposób, w jaki to się potoczyło. Myślę, że lepiej skupić się na tym, czym jest SAN i wspomnieć tylko o NAS. To starsze pytanie dotyczące „jaka jest różnica między SAN, NAS, DAS?” może zostać nieco zaktualizowany i przekształcony w kanoniczne pytania i odpowiedzi.
Totem - Przywróć Monikę

Odpowiedzi:

45

Po pierwsze, (szerokie) porównanie pamięci DAS, NAS i SAN znajduje się tutaj .


Istnieją pewne powszechne nieporozumienia dotyczące terminu „ SAN ”, co oznacza „ Storage Area Network ” i jako takie, ściśle mówiąc , odnosi się tylko do infrastruktury komunikacyjnej łączącej urządzenia pamięci masowej (macierze dyskowe, biblioteki taśm itp.) I użytkowników pamięci masowej (serwery ). Jednak w powszechnej praktyce termin „SAN” odnosi się do dwóch rzeczy:

  1. Pełna infrastruktura pamięci masowej, w tym cały sprzęt i oprogramowanie zaangażowane w zapewnianie wspólnego dostępu do centralnych urządzeń pamięci masowej z wielu serwerów. Takie użycie, choć nie do końca poprawne, jest powszechnie akceptowane i do czego odnosi się większość ludzi, mówiąc o „SAN”. Pozostała część tej odpowiedzi skupi się na niej, opisując w ten sposób każdy element infrastruktury pamięci masowej na poziomie przedsiębiorstwa.
  2. Pojedyncza tablica pamięci (patrz później); jak w „mamy markę X SAN z pamięcią 20 TB”. To użycie jest zasadniczo niepoprawne, ponieważ nawet nie bierze pod uwagę prawdziwego znaczenia „SAN” i po prostu zakłada, że ​​jest to jakaś forma urządzenia pamięci masowej.

Sieć SAN może składać się z bardzo różnych urządzeń, ale zwykle można ją podzielić na różne elementy:

  • Tablice pamięci : w tym miejscu faktycznie przechowywane są dane (i to często błędnie nazywane „SAN”). Składają się z:
    • Dyski fizyczne: oczywiście archiwizują dane. Używane są dyski na poziomie przedsiębiorstwa, co oznacza, że ​​mają zwykle mniejszą pojemność na dysk, ale znacznie wyższą wydajność i niezawodność; Ponadto, są one dużo droższe niż dyski konsument klasy. Dyski mogą korzystać z szerokiej gamy połączeń i protokołów ( SATA , SAS , FC itp.) Oraz różnych nośników pamięci ( dyski półprzewodnikowe stają się coraz bardziej popularne), w zależności od konkretnej implementacji SAN.
    • Obudowy dysków: tutaj umieszczane są dyski. Zapewniają im energię elektryczną i połączenia danych.
    • Kontrolery / procesory pamięci masowej: zarządzają dyskowymi We / Wy, RAID i buforowaniem (termin „kontroler” lub „procesor” różni się w zależności od dostawcy SAN). Ponownie stosowane są kontrolery na poziomie przedsiębiorstwa, dzięki czemu mają znacznie lepszą wydajność i niezawodność niż sprzęt klasy konsumenckiej. Mogą i zazwyczaj są skonfigurowane w parze dla redundancji.
    • Pule pamięci: pula pamięci to wiązka przestrzeni dyskowej, zawierająca niektóre (często wiele) dysków w konfiguracji RAID. Nazywa się to „pulą”, ponieważ jej sekcje mogą być przydzielane, zmieniane i cofane na żądanie, tworząc jednostki LUN.
    • Logika Liczby jednostkowe (LUN): LUN jest fragment przestrzeni poprowadzoną od puli pamięci, która jest następnie udostępniane ( „przedstawiony”) do jednego lub więcej serwerów. Jest to postrzegane przez serwery jako wolumin pamięci i może być przez nie sformatowane przy użyciu dowolnego systemu plików, który preferują.
  • Biblioteki taśm: można je podłączyć do sieci SAN i używać tej samej technologii komunikacyjnej zarówno do łączenia się z serwerami, jak i do bezpośrednich kopii zapasowych z pamięci na taśmę.
  • Sieć komunikacyjna ( właściwe „SAN” ): to pozwala użytkownikom pamięci (serwerom) na dostęp do urządzeń pamięci (macierzy pamięci, bibliotek taśm itp.); jest to, ściśle mówiąc, prawdziwe znaczenie terminu „sieć pamięci masowej” i jedyna część infrastruktury pamięci masowej, którą należy zdefiniować jako taką. Naprawdę istnieje wiele rozwiązań umożliwiających podłączenie serwerów do współużytkowanych urządzeń pamięci masowej, ale najczęstsze z nich to:
    • Fibre Channel : technologia wykorzystująca światłowód do szybkich połączeń z pamięcią współdzieloną. Obejmuje adaptery magistrali hosta , kable światłowodowe i przełączniki FC i może osiągać prędkości transferu od 1 Gbit do 20 Gbit. Ponadto wielościeżkowe we / wy mogą być używane do grupowania kilku łączy fizycznych, co pozwala na większą przepustowość i odporność na uszkodzenia.
    • iSCSI : implementacjaprotokołu SCSI w transporcie IP. Działa na standardowymsprzęcie Ethernet , co oznacza, że ​​może osiągnąć prędkości transferu od 100 Mbit (zazwyczaj nieużywane w sieci SAN) do 100 Gbit. Można także stosować wielościeżkowe operacje we / wy (chociaż podstawowa warstwa sieciowa wprowadza pewne dodatkowe złożoności).
    • Fibre Channel przez Ethernet (FCoE) : technologia pomiędzy pełną FC i iSCSI, która wykorzystuje Ethernet jako warstwę fizyczną, ale FC jako protokół transportowy, unikając w ten sposób potrzeby warstwy IP w środku.
    • InfiniBand : bardzo wydajna technologia łączności, rzadziej używana i dość droga, ale która może osiągnąć imponującą przepustowość.
  • Adaptery magistrali hosta (HBA): karty adapterów używane przez serwery do uzyskiwania dostępu do warstwy łączności; mogą to być dedykowane adaptery (jak w FC SAN) lub standardowe karty Ethernet. Istnieją również karty HBA iSCSI, które mają standardowe połączenie Ethernet, ale mogą obsługiwać protokół iSCSI sprzętowo, uwalniając w ten sposób serwer od dodatkowego obciążenia.

Sieć SAN zapewnia wiele dodatkowych możliwości w stosunku do pamięci podłączanej bezpośrednio (lub fizycznie współdzielonej):

  • Odporność na awarie: wysoka dostępność jest wbudowana w każdą sieć SAN na poziomie przedsiębiorstwa i jest obsługiwana na wszystkich poziomach, od zasilaczy w macierzach pamięci po połączenia z serwerami. Dyski są bardziej niezawodne, macierz RAID jest odporna na awarie pojedynczego dysku (lub wielu dysków), stosowane są nadmiarowe kontrolery, a wielościeżkowe operacje we / wy umożliwiają nieprzerwany dostęp do pamięci nawet w przypadku awarii łącza.
  • Większa pojemność pamięci masowej: sieci SAN mogą zawierać wiele dużych urządzeń pamięci masowej, co zapewnia znacznie większą przestrzeń dyskową niż to, co mógłby osiągnąć pojedynczy serwer.
  • Dynamiczne zarządzanie pamięcią: woluminy pamięci (LUN) można tworzyć, zmieniać ich rozmiar i niszczyć na żądanie; można je przenosić z jednego serwera na drugi; przydzielenie dodatkowej przestrzeni dyskowej serwerowi wymaga tylko niektórych konfiguracji, w przeciwieństwie do kupowania dysków i instalowania ich.
  • Wydajność: właściwie skonfigurowana sieć SAN, wykorzystująca najnowsze (choć drogie) technologie, może osiągnąć naprawdę imponującą wydajność i została zaprojektowana od podstaw do obsługi dużego obciążenia równoległego z wielu serwerów.
  • Replikacja na poziomie pamięci masowej: dwie (lub więcej) macierze pamięci masowej można skonfigurować do synchronicznej replikacji, umożliwiając pełne przekierowanie we / wy serwera między sobą w przypadku awarii lub scenariuszy awarii.
  • Migawki na poziomie pamięci masowej : większość macierzy pamięci masowej pozwala na wykonywanie migawek pojedynczych woluminów i / lub całych pul pamięci. Te migawki można następnie przywrócić w razie potrzeby.
  • Kopie zapasowe na poziomie pamięci masowej: większość sieci SAN umożliwia także wykonywanie kopii zapasowych bezpośrednio z macierzy pamięci masowej do bibliotek taśm podłączonych do sieci SAN, całkowicie pomijając serwery, które faktycznie wykorzystują dane; stosuje się różne techniki w celu zapewnienia integralności i spójności danych.

W oparciu o wszystko powyżej korzyści wynikające z używania sieci SAN są oczywiste; ale co z kosztami zakupu i złożonością zarządzania jednym?

Sieci SAN to sprzęt klasy korporacyjnej (chociaż może istnieć uzasadnienie biznesowe dla małych sieci SAN, nawet w małych / średnich firmach); są oczywiście wysoce konfigurowalne, więc mogą wahać się od „kilku TB z 1 Gbit iSCSI i nieco wysoką niezawodnością” do „kilkuset TB z niesamowitą prędkością, wydajnością i niezawodnością oraz pełną synchroniczną replikacją do centrum danych DR”; koszty różnią się odpowiednio, ale generalnie są wyższe (jak w „koszcie całkowitym”, a także „koszcie na gigabajt miejsca”) niż w przypadku innych rozwiązań. Nie ma standardu cenowego, ale nierzadko nawet małe sieci SAN mają ceny w przedziale dziesiątek tysięcy (a nawet setek tysięcy) dolarów.

Projektowanie i wdrażanie sieci SAN (jeszcze bardziej w przypadku wysokiej klasy) wymaga określonych umiejętności, a ten rodzaj pracy jest zwykle wykonywany przez wysoko wyspecjalizowane osoby. Codzienne operacje, takie jak zarządzanie jednostkami LUN, są znacznie łatwiejsze, ale w wielu firmach zarządzanie pamięcią jest w każdym razie obsługiwane przez dedykowaną osobę lub zespół.

Niezależnie od powyższych rozważań, sieci SAN są rozwiązaniem pamięci masowej, w którym wymagana jest wysoka pojemność, niezawodność i wydajność.

Massimo
źródło
3
Głosuj ++ na tak szczegółową odpowiedź.
Simon Catlin,
3

Potrzebujesz jednego? Zależy. £ lub $ za TB jest znacznie wyższy niż DAS. Plus, obawiam się, że wydajność DAS przewyższa FC / AL i iSCSI SAN (cóż, przynajmniej w moich testach z bazami danych Oracle i SQL Server). Ale dzięki DAS nie zyskujesz korzyści z dzielenia przestrzeni dyskowej (dobre dla klastrowania i VMWare).

Wielu dostawców pamięci masowej migruje z kanału światłowodowego dla połączeń między hostem a kontrolerem pamięci, na rzecz iSCSI, który działa na Ethernecie. To znowu stara saga Token-Ring vs Ethernet; przy tak wielu branżowych badaniach i inwestycjach w Ethernet, FC po prostu nie może nadążyć. Przełącznik Ethernet 10 Gb / s jest znacznie tańszy niż przełącznik FC 8 Gb / s, a ponadto może być vLANd lub w inny sposób podzielony na segmenty, aby zapewnić pamięć i dane inne niż pamięć.

Istnieją jednak duże zalety sieci SAN:

  • Migawki SAN (punkt odzyskiwania w czasie dla serwera lub kolekcji serwerów)
  • Replikacja na poziomie bloku na miejscu i poza nim (bez udziału serwera hosta, więc nie ma potrzeby replikacji programowej)
  • Bezpośrednie kopie zapasowe SAN - jeśli system kopii zapasowych może się podłączyć i współpracować z siecią SAN

Jeśli zastanawiasz się nad zanurzeniem palca w wodzie we wspólnej pamięci, spójrz na produkty takie jak zestaw HP P4000.

Simon Catlin
źródło