Czy mogę działać niezawodnie z jedną kartą Fusion-io zainstalowaną na serwerze, czy też muszę wdrożyć dwie karty w programowej konfiguracji RAID?
Fusion-io nie jest bardzo jasne (prawie wprowadzające w błąd) na ten temat podczas recenzowania swoich materiałów marketingowych Biorąc pod uwagę koszt kart, jestem ciekawy, jak inni inżynierowie wdrażają je w rzeczywistych scenariuszach.
Planuję użyć karty Fusion-io ioDrive2 marki HP o pojemności 1,2 TB do zastrzeżonego, samodzielnego rozwiązania bazodanowego działającego w systemie Linux. Jest to konfiguracja z pojedynczym serwerem bez rzeczywistej opcji wysokiej dostępności. Nie jest asynchroniczna replikacja z 10-minutowego RPO że transakcja lusterka loguje się do drugiego serwera fizycznego.
Tradycyjnie wybrałbym wysokiej klasy serwer HP ProLiant z najwyższym stopniem procesora dla tej aplikacji. Muszę przejść na dysk SSD i mogę uzyskać Fusion-io po niższej cenie niż dysk SSD SAS dla przedsiębiorstw za wymaganą pojemność.
- Czy muszę uruchomić dwie karty ioDrive2 i połączyć je z oprogramowaniem RAID (md lub ZFS), czy to nie jest konieczne?
- Czy powinienem martwić się awarią Fusion-io bardziej niż awarią kontrolera RAID lub awarii płyty głównej?
- Administratorzy systemu, tacy jak RAID. Czy wymaga to innego sposobu myślenia, biorąc pod uwagę inny interfejs i wyrównanie zużycia na karcie / korekcję błędów dostępne w tej formie?
- Jaki jest wskaźnik awaryjności tych urządzeń?
Edycja: Właśnie przeczytałem oficjalny dokument na temat niezawodności Fusion-io od firmy Dell, a na wynos wydaje się być „Karty Fusion-io mają wiele wewnętrznych nadmiarowości ... Nie martw się o RAID !!” .
Odpowiedzi:
Ostatecznie sprowadza się to do twojego modelu awarii. Jaki jest wpływ awarii?
Historycznie zawsze RAIDowaliśmy wszystko, ponieważ koszt takiego działania był znikomy. Kolejne 500 USD na dysk do tworzenia kopii lustrzanych? Całkowicie warte kosztu, nawet go nie rozważając.
Kiedy mówisz o kolejnych 10 000 $ +, aby włączyć kopię lustrzaną, wymaga to nieco więcej uwagi.
Nie, nie musisz wykonywać kopii lustrzanej
Karty Fusion-io mają dość dobrą wewnętrzną redundancję. To nie jest rodzaj sprzętu, w którym dysk jest pojedynczym układem. W większości sytuacji, w których zaobserwowałem awarię, problem z oprogramowaniem układowym wpłynął na obu członków dublowania, więc RAID nie miałby znaczenia.
Pomyśl o karcie Fusion-io jako kontrolerze RAID z dyskami za nią. Czy wszystko w porządku z konfiguracją pojedynczego kontrolera? Prawdopodobnie. Traktuj to w ten sposób.
W wielu konfiguracjach, w których wdrażasz dyski Fusion-io, będziesz mieć wbudowane inne zabezpieczenia (nadmiarowość na poziomie węzła), więc nie ma to większego sensu.
Tak, musisz wykonać kopię lustrzaną
RAID zwiększa dostępność . Czy potrzebujesz absolutnie maksymalnej dostępności pomimo kosztów? Czy koszt awarii i ewentualnych przestojów jest drogi? Śmiało i odbij dyski. W statystycznie dużej konfiguracji będziesz mieć awarie dysków pomimo wewnętrznych zabezpieczeń.
źródło
Nadmiarowość na urządzeniu powinna dobrze sobie poradzić z awariami układów flash - analogicznie do RAID wśród wszystkich komponentów faktycznie przechowujących dane.
Awaria całego urządzenia byłaby prawie analogiczna do utraty kontrolera RAID lub płyty głównej - byłbym mniej więcej tak samo zmartwiony kartą Fusion-io, jak inne komponenty z pojedynczym punktem awarii, chociaż nie „ Ma doświadczenie w pracy z urządzeniami na dużą skalę, aby móc porównywać wskaźniki awarii przy użyciu twardych danych.
Dodanie nadmiarowości oprócz tego, co już ma urządzenie (powiedzmy programowe RAID wśród wielu kart Fusion-io), byłoby bardzo podobne do robienia programowego RAID między dwoma sprzętowymi grupami RAID na dwóch różnych kontrolerach RAID; może być opłacalne dla systemów gwarantujących ekstremalną redundancję w celu usunięcia dodatkowego pojedynczego punktu awarii, ale nie w przypadku typowych wdrożeń (10 minut RPO w lustrze powinno wystarczyć dla większości aplikacji?).
Tak, tak myślę. Zasadniczo otrzymujesz urządzenie, które przypomina kontroler RAID i kilka urządzeń pamięci masowej za nim w jednym pakiecie. Zdecydowanie kuszące jest martwienie się o umieszczenie poufnych danych na jednym urządzeniu, ale trzeba mieć pewien poziom zaufania do wewnętrznej nadmiarowości urządzenia ... Które należy zrównoważyć zdrowym rozumieniem „RAID nie jest kopia zapasowa ”: zawsze przygotuj się na awarię nadmiarowego komponentu lub usuń z niego dane, korzystając z dobrych kopii zapasowych.
źródło
Jak wiesz, używaliśmy ich zestawu od dłuższego czasu, zarówno w konfiguracjach RAID, jak i innych niż RAID - chciałbym mieć trochę doświadczenia z porażką, ale nie mam. Nie mieliśmy żadnych awarii, w których pomógłby RAID, a ich wbudowane funkcje odpornościowe są coraz lepsze. Również główna funkcja, do której ich używamy, jest teraz skalowana / klastrowana w poziomie, więc mamy jeszcze mniej powodów, aby je RAIDować. Świetne karty, bardzo je polecam.
źródło
Nie znam bezpośrednio Fusion, ale mam trochę doświadczenia z PCIe SSD.
Te, w których pracuję z obecnymi czterema różnymi jednostkami LUN w systemie operacyjnym i traktują kartę PCIe jak HBA. Jeśli chcę RAID, dublowałbym razem dwie jednostki LUN przy użyciu systemu operacyjnego. To pozwala mi na rozwiązanie z jedną kartą dla redundancji. Chociaż jeśli karta całkowicie zawiedzie, nadal jestem w potoku. Nie wiem, czy ioDrive robi to samo.
źródło
Kupiłem 6 kart 1,2 TB w ciągu ostatnich kilku miesięcy. Jeden z nich już zawiódł. Więc absolutnie ich napadnę. Użyłem Windows Mirror Disk Active. Napęd nie powiódł się z komunikatem „brak mapy LEB”. Powiedziano mi, że trzeba go wymienić. Ale aby uzyskać akceptację RMA, musiałbym zrobić zdjęcia po obu stronach uszkodzonej karty (wymagającej przerwy w produkcji w celu wyjęcia karty). A potem powiedzieli mi, że karta zastępcza jest niedostępna bez eta. Możesz więc pomyśleć dość intensywnie, zanim je kupisz.
źródło