Jak mogę bezpiecznie korzystać z elastycznego udostępniania pamięci masowej?

19

Mam pamięć, która pozwala mi na cienkie udostępnianie moich woluminów prezentowanych klientom. Czy to jest bezpieczne? Jakie są najlepsze praktyki?

Bazylia
źródło

Odpowiedzi:

16

Zasadniczo, bez względu na to, czy mówimy o jednostkach SCSI LUN (SAN), czy sieciowych systemach plików (NAS), pamięć elastyczna alokowana jest wtedy, gdy mówimy klientowi pamięci, że ma on więcej miejsca, niż faktycznie mu przydzielono. Nie stanowi to samo w sobie żadnego ryzyka, ale jeśli nie masz wystarczającej ilości miejsca do przechowywania każdego pojedynczego kontenera, aby osiągnąć pełny obiecany rozmiar, nazywa się to nadmierną kontrolą i pociąga za sobą ryzyko.

Zalety

Zalety nadmiernej kontroli i cienkiego udostępniania są przekonujące. Wielu konsumentów pamięci masowej (serwery, użytkownicy udostępniania plików itp.) Zażąda znacznie więcej pamięci, niż początkowo potrzebuje, i nadal zapewnia bezpieczny margines wzrostu w miarę wzrostu. Centralnie zabezpieczony bezpieczny margines wzrostu jest znacznie bardziej wydajny niż setki małych. Wykorzystanie podstawowej pamięci masowej bez cienkiego / nadmiernego zaopatrzenia może być bardzo niskie, a to pozwala na wyższą stopę wykorzystania.

Ryzyko

Wszystkie ryzyka związane z tym scenariuszem wiążą się z nadmierną kontrolą. Im więcej nadwyżki, tym większe ryzyko. Niebezpieczeństwo polega na tym, że wykorzystanie zasobów pamięci może całkowicie wypełnić dostępną pamięć, co ogólnie spowoduje awarię wszystkich kontenerów pamięci w taki czy inny sposób. Systemy plików przejdą w tryb tylko do odczytu lub offline, a jednostki LUN przejdą w tryb offline.

Najlepsze praktyki

Aby uzyskać korzyści wynikające z większego wykorzystania, które wiążą się z nadmierną kontrolą, przy jednoczesnym zmniejszeniu ryzyka, musisz stale monitorować pamięć masową i być w stanie podjąć działania w razie potrzeby.

  • Użyj oprogramowania do monitorowania i ostrzegania o warunkach użytkowania puli. Jeśli w pudełku nie ma nic, co by to zrobiło, napisz to sam. Większość pamięci obsługuje polecenia CLI, które można odczytać za pomocą skryptu, który ma być często uruchamiany. Częstotliwość powinna być wystarczająco wysoka, aby żadna z twoich pul nie była w stanie zapełnić się między zdarzeniami odpytywania.
  • Ustal próg odniesienia. Wszystkie nowe pule pamięci z klientami z nadmierną kontrolą powinny być domyślnie stosowane. Ten próg powinien być najbardziej konserwatywny w twoim środowisku.
  • W przypadku mniejszych pul użyj niższego progu. Jeśli dasz sobie 30% ostrzeżenia w puli 100 TB, masz dużo więcej czasu na dodanie dysku niż w przypadku 30% ostrzeżenia w puli 10 TB, zakładając, że oba są w stanie przyjmować zapisy z tą samą prędkością.
  • Dostosuj próg, jeśli jesteś mniej przereklamowany. Jeśli masz pulę, która ma tylko 106% nadmiernej kontroli, osiągnięcie 70% wykorzystania nie jest tak ryzykowne jak pula, która ma 200% nadmiernej kontroli.
  • Dostosuj progi na podstawie tego, ile czasu potrzebujesz, aby dodać miejsce do puli. W moim sklepie przechowujemy pamięć online w każdym pudełku powstrzymywanym do wzrostu w dowolnej puli, a więcej miejsca na półce gotowej do zainstalowania w dowolnym pudełku. Robimy to, aby uzyskać wystarczającą liczbę rodzajów pamięci, abyśmy mogli obsłużyć wzrost w dowolnej puli.
  • Tam, gdzie to możliwe i stosowne, zmniejsz ilość miejsca do przechowywania. Deduplikacja działa w celu zmniejszenia wykorzystania, a jeśli używasz jednostek LUN, odzyskiwanie zerowej strony i klienci, którzy są w stanie wykonać pamięć masową, usuwają przydziały po usunięciu danych, pomagają.
Bazylia
źródło
Podjęliśmy decyzję o „subskrypcji” zarówno pod względem pojemności rezerwowej, jak i łącznej. Ale także pod względem niewykorzystanej rezerwy vs. wolnej przestrzeni. Tak więc w twoim przykładzie - 70% wykorzystania, z 200% subskrypcją - masz pozostałe 130% rezerw na 30% faktycznej przestrzeni dyskowej, co daje ci 433% współczynnik subskrypcji. (gdzie „106% vs. 70%” oznacza 36%: 30% = 120%)
Sobrique,
Nie mówimy nic klientom o tym, ale z pewnością obniżamy próg, który spowodowałby dodanie dysku, gdy mamy większą pojemność.
Basil
Obciążenie zwrotne i sprawozdawczość to z pewnością ważna część do przemyślenia. Naprawdę mam dwa umysły - z jednej strony, jeśli nie muszą wiedzieć i ufają zespołowi zajmującemu się przechowywaniem danych, to - moim zdaniem - jest to najlepszy sposób. Jednak natknąłem się na sytuacje, w których ufają zespołowi zajmującemu się przechowywaniem danych - dopóki nie nadejdzie czas na zasypanie, więc spróbuj zablokować zamówienie na więcej dysków.
Sobrique,
1
Uznaliśmy, że można przekazać oszczędności równomiernie wszystkim klientom pamięci masowej. Opłacamy za adresowaną TB.
Basil
Koszt miesięczny czy kapitałowy? Ten ostatni mnie potknął, po prostu dlatego, że bardzo trudno jest oszacować wskaźniki w całym okresie użytkowania. Ale może być trudno przekonać księgowych, że nie chcesz już robić modeli nakładów inwestycyjnych.
Sobrique
9

Cel i cel cienkiej alokacji jest podobny do powodu korzystania ze skonsolidowanego magazynu w pierwszej kolejności - dzięki konsolidacji uzyskuje się lepszą pojemność szczytową przy niższej średniej potrzebnej.

Ale nie miej złudzeń - cienkie przydzielanie zasobów to udawanie, że coś przydzielasz, a nie robiąc tego. Jest wiele powodów, dla których jest to przydatne. Dwa kluczowe to:

  • Wyższe wykorzystanie - o ile woluminy nie są całkowicie zapełnione, miejsce na dysku jest marnowane. Większość systemów nie działa w 100% przez cały czas (i ogólnie przyjmuje się, że są w kłopotach, jeśli są).

  • Odroczone wydatki - jeśli dam dzisiaj 10 TB, ale zapełnisz je 2 TB rocznie, prawdopodobnie mogę zapłacić mniej, jeśli poczekam przed zakupem dysków.

Jednak z tego wynikają dwa błędy:

  • zbyt szybko kończy się dysk - ktoś, kto zaczyna zapełniać „swoje” dyski, może zabraknąć pozostałej części przedsiębiorstwa.

  • liczy się wrzeciono - kupowanie mniejszej liczby dysków oznacza, że ​​masz mniej wrzecion, a tym samym mniej procesorów IOP. Co oznacza, że ​​dyski będą działać cieplej, a wydajność będzie gorsza.

Rzeczy, które poleciłbym jako najlepsze praktyki w zakresie cienkiego udostępniania:

  • Zaakceptuj ryzyko związane z zarządzaniem.
  • ustawić „akceptowalny” wskaźnik nadsubskrypcji. (Jest to decyzja dotycząca ryzyka biznesowego, więc oddaj ją w górę).
  • Weź również pod uwagę indywidualne rozmiary woluminów. Wolumin 20 TB jest bardziej podatny na pożeranie miejsca niż wiele woluminów 100 GB.
  • Przygotuj pojemność (lub zamówienie), gdy zaczniesz się kończyć (na podstawie „wolnego miejsca” lub „wielkości woluminu”). Nie dostajesz tyle ostrzeżenia, że ​​wkrótce skończy Ci się, i prawdopodobnie możesz czekaj do następnego kwartału / roku obrotowego, aby wypełnić - nie kupujesz już nowych zdolności, ponownie wypełniasz rzeczy, które już „sprzedałeś”.
  • Rozważ teoretyczną maksymalną pojemność swojego systemu pamięci masowej. Zastanów się bardzo, co zrobisz, jeśli przejdziesz obok tego.
  • zwracaj szczególną uwagę na swoje wyniki. Procesory IOP / przepustowość oba. Prawdopodobnie nie otrzymasz dobrej odpowiedzi na pytania „ile potrzebujesz wydajności”. Ale może się okazać, że „wyczerpuje się” wydajność szybciej niż w innym przypadku. Ustaw też próg dla tego.
  • rozważ odpowiednio swoje obciążenie. Zaoszczędź pieniądze, korzystając z cienkiej obsługi administracyjnej, ale POTRZEBUJESZ jej części, aby nadążyć za modelem elastycznej obsługi administracyjnej.

Nie mogę przecenić tego ostatniego punktu. Być może masz klientów, którzy proszą o przechowywanie i nigdy go nie używają. To pieniądze, które nie wydałeś i stanowią oszczędności. Nie jest to jednak to samo, co klienci, którzy korzystają z niego dłużej (np. Dłużej niż rok budżetowy) - oszczędzasz pieniądze, kupując większe / tańsze dyski w przyszłym roku. Ale NIE uciekasz przed „sprzedażą” przestrzeni z góry i mając nadzieję, że nikt nigdy jej nie wykorzysta. Być może z czasem skończysz zapełnianie całej partii i musisz być gotowy do wypełnienia.

Sobrique
źródło
1
W moim sklepie nadsubskrypcja nie jest widoczna dla właścicieli danych, chyba że o to poproszą. Podejmujemy decyzję o przechowywaniu, ale obiecujemy, że nigdy nie zepsujemy puli.
Basil
1
Jest to opcja - i prawdopodobnie rozsądna, pod warunkiem, że „pamięć” nie będzie musiała walczyć o nakłady inwestycyjne „więcej dysków”. To bardziej kwestia polityki i finansów :)
Sobrique