Czy potrzebuję kart RAID Fusion-io?

27

Czy mogę działać niezawodnie z jedną kartą Fusion-io zainstalowaną na serwerze, czy też muszę wdrożyć dwie karty w programowej konfiguracji RAID?

Fusion-io nie jest bardzo jasne (prawie wprowadzające w błąd) na ten temat podczas recenzowania swoich materiałów marketingowych Biorąc pod uwagę koszt kart, jestem ciekawy, jak inni inżynierowie wdrażają je w rzeczywistych scenariuszach.

Planuję użyć karty Fusion-io ioDrive2 marki HP o pojemności 1,2 TB do zastrzeżonego, samodzielnego rozwiązania bazodanowego działającego w systemie Linux. Jest to konfiguracja z pojedynczym serwerem bez rzeczywistej opcji wysokiej dostępności. Nie jest asynchroniczna replikacja z 10-minutowego RPO że transakcja lusterka loguje się do drugiego serwera fizycznego.

Tradycyjnie wybrałbym wysokiej klasy serwer HP ProLiant z najwyższym stopniem procesora dla tej aplikacji. Muszę przejść na dysk SSD i mogę uzyskać Fusion-io po niższej cenie niż dysk SSD SAS dla przedsiębiorstw za wymaganą pojemność.

  • Czy muszę uruchomić dwie karty ioDrive2 i połączyć je z oprogramowaniem RAID (md lub ZFS), czy to nie jest konieczne?
  • Czy powinienem martwić się awarią Fusion-io bardziej niż awarią kontrolera RAID lub awarii płyty głównej?
  • Administratorzy systemu, tacy jak RAID. Czy wymaga to innego sposobu myślenia, biorąc pod uwagę inny interfejs i wyrównanie zużycia na karcie / korekcję błędów dostępne w tej formie?
  • Jaki jest wskaźnik awaryjności tych urządzeń?

Edycja: Właśnie przeczytałem oficjalny dokument na temat niezawodności Fusion-io od firmy Dell, a na wynos wydaje się być „Karty Fusion-io mają wiele wewnętrznych nadmiarowości ... Nie martw się o RAID !!” .

ewwhite
źródło
Czy rajd programowy i / lub magistrala PCIe zdołają nadążyć, jeśli przekroczysz limit IOPS? Naprawdę nie mam pojęcia, ale warto to sprawdzić.
pauska
1
Magistrala PCIe będzie nadążać. Oprogramowanie RAID (jeśli POTRZEBUJĘ ) będzie oparte na ZFS, więc jest w stanie. Na razie zamówiłem dwie karty, ale literatura Fusion-io wydaje się mówić: „jedna karta jest wystarczająco dobra”.
ewwhite
Nawet ZFS musi używać cykli procesora do dublowania danych, więc zwiększa złożoność i opóźnienie - ale nie wiadomo, jak bardzo wpłynie to na twoją aplikację. Wydaje się, że Fusion jest bardzo dumny z niskiego kosztu procesora w wewnętrznym
zapisie

Odpowiedzi:

16

Ostatecznie sprowadza się to do twojego modelu awarii. Jaki jest wpływ awarii?

Historycznie zawsze RAIDowaliśmy wszystko, ponieważ koszt takiego działania był znikomy. Kolejne 500 USD na dysk do tworzenia kopii lustrzanych? Całkowicie warte kosztu, nawet go nie rozważając.

Kiedy mówisz o kolejnych 10 000 $ +, aby włączyć kopię lustrzaną, wymaga to nieco więcej uwagi.


Nie, nie musisz wykonywać kopii lustrzanej

Karty Fusion-io mają dość dobrą wewnętrzną redundancję. To nie jest rodzaj sprzętu, w którym dysk jest pojedynczym układem. W większości sytuacji, w których zaobserwowałem awarię, problem z oprogramowaniem układowym wpłynął na obu członków dublowania, więc RAID nie miałby znaczenia.

Pomyśl o karcie Fusion-io jako kontrolerze RAID z dyskami za nią. Czy wszystko w porządku z konfiguracją pojedynczego kontrolera? Prawdopodobnie. Traktuj to w ten sposób.

W wielu konfiguracjach, w których wdrażasz dyski Fusion-io, będziesz mieć wbudowane inne zabezpieczenia (nadmiarowość na poziomie węzła), więc nie ma to większego sensu.


Tak, musisz wykonać kopię lustrzaną

RAID zwiększa dostępność . Czy potrzebujesz absolutnie maksymalnej dostępności pomimo kosztów? Czy koszt awarii i ewentualnych przestojów jest drogi? Śmiało i odbij dyski. W statystycznie dużej konfiguracji będziesz mieć awarie dysków pomimo wewnętrznych zabezpieczeń.

MikeyB
źródło
Aktualizacja: dublowałem karty Fusion-io w instalacjach, w których klient był w porządku z dodatkowymi wydatkami (i aby ułatwić sobie wdrożenie produktu). W innych sytuacjach wdrożyłem wiele instalacji z jedną kartą. Jak dotąd wszystko było dobrze ...
ewwhite
18

Nadmiarowość na urządzeniu powinna dobrze sobie poradzić z awariami układów flash - analogicznie do RAID wśród wszystkich komponentów faktycznie przechowujących dane.

Czy powinienem martwić się awarią Fusion-io bardziej niż awarią kontrolera RAID lub awarii płyty głównej?

Awaria całego urządzenia byłaby prawie analogiczna do utraty kontrolera RAID lub płyty głównej - byłbym mniej więcej tak samo zmartwiony kartą Fusion-io, jak inne komponenty z pojedynczym punktem awarii, chociaż nie „ Ma doświadczenie w pracy z urządzeniami na dużą skalę, aby móc porównywać wskaźniki awarii przy użyciu twardych danych.

Czy muszę uruchomić dwie karty ioDrive2 i połączyć je z oprogramowaniem RAID (md lub ZFS), czy to nie jest konieczne?

Dodanie nadmiarowości oprócz tego, co już ma urządzenie (powiedzmy programowe RAID wśród wielu kart Fusion-io), byłoby bardzo podobne do robienia programowego RAID między dwoma sprzętowymi grupami RAID na dwóch różnych kontrolerach RAID; może być opłacalne dla systemów gwarantujących ekstremalną redundancję w celu usunięcia dodatkowego pojedynczego punktu awarii, ale nie w przypadku typowych wdrożeń (10 minut RPO w lustrze powinno wystarczyć dla większości aplikacji?).

Administratorzy systemów tacy jak RAID. Czy wymaga to innego sposobu myślenia, biorąc pod uwagę inny interfejs i wyrównanie zużycia na karcie / korekcję błędów dostępne w tej formie?

Tak, tak myślę. Zasadniczo otrzymujesz urządzenie, które przypomina kontroler RAID i kilka urządzeń pamięci masowej za nim w jednym pakiecie. Zdecydowanie kuszące jest martwienie się o umieszczenie poufnych danych na jednym urządzeniu, ale trzeba mieć pewien poziom zaufania do wewnętrznej nadmiarowości urządzenia ... Które należy zrównoważyć zdrowym rozumieniem „RAID nie jest kopia zapasowa ”: zawsze przygotuj się na awarię nadmiarowego komponentu lub usuń z niego dane, korzystając z dobrych kopii zapasowych.

Shane Madden
źródło
13

Jak wiesz, używaliśmy ich zestawu od dłuższego czasu, zarówno w konfiguracjach RAID, jak i innych niż RAID - chciałbym mieć trochę doświadczenia z porażką, ale nie mam. Nie mieliśmy żadnych awarii, w których pomógłby RAID, a ich wbudowane funkcje odpornościowe są coraz lepsze. Również główna funkcja, do której ich używamy, jest teraz skalowana / klastrowana w poziomie, więc mamy jeszcze mniej powodów, aby je RAIDować. Świetne karty, bardzo je polecam.

Siekacz 3
źródło
Dobry punkt danych. Nie mogę jednak stwierdzić, czy dodanie warstwy RAID jest nadmierne, czy nie.
ewwhite
1
Uważam, że technologia nie jest tu punktem odniesienia - albo twoje dane potrzebują zdolności do obsługi utraty pojedynczej karty FusionIO, albo nie - po prostu myśl o nich jako o szybkich, szybkich dyskach - to nie zmienia, czy ty może żyć bez RAID czy nie?
Chopper3
Nieznacznie ... Tradycyjnym podejściem byłoby użycie korporacyjnych dysków SSD SAS w macierzy RAID 1 + 0. To po prostu zastosowanie tego samego standardu, który stosuje się przy spinaniu dysków na dyskach SSD. Ale zakłada to również możliwość wymiany na gorąco. Nie dotyczy to karty opartej na PCIe, szczególnie gdy będę zmuszony użyć programowego RAID, aby to osiągnąć. Ponieważ Fusion-io ma również zaletę lepszego wyrównywania zużycia i monitorowania, staram się zrozumieć realistyczne tryby awarii. Czy traktuję Fusion-io jak dyski lub kontroler? Nie umieściłbyś dwóch kart Smart Array w ProLiant do obsługi dysków wewnętrznych, prawda?
ewwhite
2
@ewwhite Być może masz dwa kontrolery RAID z różnymi dyskami i RAID1 między dyskami kontrolerów, jeśli chcesz być w stanie poradzić sobie z awarią kontrolera RAID. Powiedziałbym, że traktuj kartę Fusion-io jak kontroler RAID pod względem planowania nadmiarowości.
Shane Madden
@ewwhite Jeśli spojrzysz na użyte przeze mnie sformułowanie, możesz przeczytać między wierszami, że mieliśmy jedną awarię na jednym serwerze wyposażonym w FusionIO - mieliśmy mobo go pop - DL580 G6 (mamy ich bardzo niewiele) i coś przydarzyło się jednemu bankowi pamięci i wyjęło to, kto jest na pokładzie. W tym scenariuszu był to RAID 1, ale oczywiście to nie miało znaczenia. Oczywiście należy pamiętać, że PCIe można wymieniać na gorąco, może to być ogromny problem, ale może działać dobrze.
Chopper3
9

Nie znam bezpośrednio Fusion, ale mam trochę doświadczenia z PCIe SSD.

Te, w których pracuję z obecnymi czterema różnymi jednostkami LUN w systemie operacyjnym i traktują kartę PCIe jak HBA. Jeśli chcę RAID, dublowałbym razem dwie jednostki LUN przy użyciu systemu operacyjnego. To pozwala mi na rozwiązanie z jedną kartą dla redundancji. Chociaż jeśli karta całkowicie zawiedzie, nadal jestem w potoku. Nie wiem, czy ioDrive robi to samo.

sysadmin1138
źródło
Ta konkretna jednostka zaprezentuje jedno urządzenie blokowe.
ewwhite
1
ioDrives prezentują jedno lub dwa niezależne urządzenia. Jeśli przedstawia dwa, są to fizycznie dwa osobne urządzenia na jednej karcie, każda z własną ochroną wewnętrzną. Porównajmy, powiedzmy, Intel 910, który prezentuje cztery urządzenia, z których każde powinno być traktowane jako dysk SSD.
MikeyB
5

Kupiłem 6 kart 1,2 TB w ciągu ostatnich kilku miesięcy. Jeden z nich już zawiódł. Więc absolutnie ich napadnę. Użyłem Windows Mirror Disk Active. Napęd nie powiódł się z komunikatem „brak mapy LEB”. Powiedziano mi, że trzeba go wymienić. Ale aby uzyskać akceptację RMA, musiałbym zrobić zdjęcia po obu stronach uszkodzonej karty (wymagającej przerwy w produkcji w celu wyjęcia karty). A potem powiedzieli mi, że karta zastępcza jest niedostępna bez eta. Możesz więc pomyśleć dość intensywnie, zanim je kupisz.

użytkownik229000
źródło
Dziękujemy za podzielenie się wrażeniami. Poszedłem dalej i wdrożyłem te karty 1,2 TB w parach lustrzanych. Korzystam z kodów SKU HP, więc mam umowę wsparcia HP dotyczącą obsługi RMA / wymiany.
ewwhite