ZFS i SAN - najlepsze praktyki?

16

Większość dyskusji na temat ZFS sugeruje wyłączenie sprzętowej macierzy RAID i że ZFS powinien bezpośrednio rozmawiać z dyskami i zarządzać macierzą RAID na hoście (zamiast kontrolera RAID).

Ma to sens na komputerze z 2-16 lub nawet więcej dyskami lokalnymi, ale co z otoczeniem z dużą siecią SAN?

Na przykład przedsiębiorstwo, dla którego pracuję, ma coś, co uważam za SAN o skromnej wielkości z 2 pełnymi stelażami dysków, co przypomina około 400 wrzecion. Widziałem półki SAN, które są o wiele gęstsze niż nasze, a wdrożenia SAN znacznie większe niż nasze.

Czy ludzie wystawiają 100 dysków bezpośrednio na duże serwery ZFS? 300 dysków? 3000 dysków? Czy narzędzia do zarządzania SAN ułatwiają zautomatyzowane zarządzanie tego rodzaju rzeczami?

Chris
źródło

Odpowiedzi:

5

FWIW Mam doświadczenie z maksymalnie 92 dyskami w jednej puli ZFS i jak na razie działa dobrze.

Ale jeśli naprawdę mówisz o kilkuset dyskach, rozważę podzielenie ich na kilka rozłącznych (ale wciąż dużych) pul. Nie chcę wiedzieć, jak długo np. zpool scrubDziała na puli dyskowej 3000 (ale chcesz regularnie szorować). Również wyjście takich poleceń zpool statusbyłoby niewygodne przy tak dużej liczbie dysków. Po co więc wkładać wszystkie jajka do jednego koszyka?

(Uwaga dodatkowa na temat deduplikacji : zauważ, że chociaż deduplikacją można sterować na poziomie zestawu danych, znajdzie duplikaty na poziomie puli. Tzn. Prawdopodobnie uzyskasz gorsze wyniki deduplikacji, jeśli partycjonujesz zgodnie z sugestią. Z drugiej strony potrzebujesz dużo więcej pamięci, aby przechowywać skróty deduplikacji pojedynczej gigantycznej puli, która może nie pasować do ARC + L2ARC, jeśli pula jest zbyt duża. Jeśli więc używasz dedupcji, ilość dostępnej pamięci jest prawdopodobnie dobrym wskaźnikiem maksymalnego praktycznego rozmiaru puli .)

knweiss
źródło
1
+1 zgadzam się. Nie musisz umieszczać wszystkich dysków w bardzo dużej puli.
PiL
Myślałem ... czy jakieś san (najczęściej z HP, IBM, EMC i tak dalej) wystawia wszystkie dyski bezpośrednio na pudełka? A może musisz (o ile widziałem) stworzyć lunów, a następnie powiązać je z serwerami? Lub, jak zamierza Chris, to bardziej jak jakiś DAS?
PiL
Należy pamiętać, że dział wsparcia Sun / Oracle zaleca wyłączenie deduplikacji nawet w ich własnej serii produktów OpenStorage, ponieważ wydajność jest dość drastyczna.
pfo
3

Pozwalamy naszym sieciom SAN zarządzać macierzą RAID. Po co wydawać pieniądze na całą pamięć NVRAM z podtrzymaniem bateryjnym i te dedykowane procesory, a następnie odciążyć pracę na serwerze, którego procesorów chcę robić inaczej niż sumy kontrolne RAID?

Rodger
źródło
1
Myślę, że ta zagadka jest nazywana „kołem reinkarnacji”, gdzie istnieje stały cykl między odciążaniem zadań do wyspecjalizowanego procesora, a następnie rolowaniem zadań z powrotem na procesor, ponieważ procesor ogólnego przeznaczenia jest szybszy niż wyspecjalizowane procesory.
Chris
2

To stare pytanie, ale dzisiaj jest tak samo aktualne, jak 7 lat temu!

Aby odpowiedzieć na pierwszą część pytania, nie jestem świadomy tego, co nazwalibyśmy „SAN”, która kiedykolwiek wystawiałaby surowe dyski serwerowi, który mógłby uruchomić ZFS. SAN z definicji przedstawia tylko pamięć blokową (LUN) lub może coś takiego jak Filer / FS przedstawia NFS lub CIFS. Istnieją pewne „sieci SAN”, które faktycznie uruchamiają ZFS wewnętrznie, ale jest to w dużej mierze abstrakcyjne - dyski nigdy nie są narażone na działanie serwera, zamiast tego składnik „Filer” sieci SAN przedstawia serwery blokowym lub sieciowym systemom plików.

Urządzenie, które prezentuje dyski surowe (przez SAS lub mniej prawdopodobne przez FC) to DAS. Aby uruchomić ZFS, zwykle powinieneś powiedzieć kontrolerowi RAID, aby prezentował dyski jako JBOD.

Jednak czy powinieneś używać ZFS na jednostce LUN przedstawionej przez SAN? Być może: ZFS vs na przykład EXT4 zapewnia kilka dodatkowych funkcji, takich jak scruby, które sprawdzają sumy kontrolne lub uruchamianie migawek. Scrub prawdopodobnie nie może automatycznie leczyć w taki sam sposób, jak może, jeśli robi RAID dysku, ale nadal może ostrzegać o uszkodzeniu, pomagając zapobiegać bitrotowi. Migawki, które można utworzyć na przykład na serwerze plików Linux SAMBA, są znacznie lepsze od tego, co można zrobić za pomocą EXT, mogą nawet być widoczne w systemie Windows jako „Poprzednie wersje”.

Jon Rhoades
źródło
1

Jeśli nie udostępnisz nadmiarowych danych ZFS do pracy (np. Kopii lustrzanych, RAID-Z), tracisz wiele korzyści z ich używania. Liczba zaangażowanych dysków nie zmieni tego faktu. Jednak to, czy ma to znaczenie, zależy od twojego środowiska. Musisz określić, jakich funkcji przechowywania potrzebujesz (analiza potencjalnie pracochłonna), a następnie poszukać najtańszego rozwiązania (na które Cię stać), które spełni twoje potrzeby. Może to oznaczać używanie ZFS wszędzie wraz ze specjalistycznymi urządzeniami pamięci masowej Oracle (niektóre osoby to robią i wiele dysków bez problemu wystawia się na działanie ZFS i korzysta z narzędzi Oracle do zarządzania), może to oznaczać używanie tylko korporacyjnych produktów SAN lub może oznaczać używanie niektóre hybrydy (w takim przypadku prawdopodobnie będziesz musiał samodzielnie opracować narzędzia i procesy do zarządzania środowiskiem). Don'

Tekhne
źródło