Jaki jest obecny stan (2016) dysków SSD w macierzy RAID?

51

Istnieje wiele zasobów dostępnych online, które dyskutują na temat używania dysków SSD w konfiguracjach RAID - jednak przeważnie pochodzą one z kilku lat, a ekosystem dysków SSD bardzo szybko się zmienia - właśnie dlatego, że spodziewamy się wydania produktu Intel Optane pod koniec tego roku co zmieni wszystko ... znowu.

Przedłożę moje pytanie, stwierdzając, że istnieje jakościowa różnica między dyskami SSD klasy konsumenckiej (np. Intel 535) a dyskami SSD klasy centrum danych (np. Intel DC S3700).

Moje główne obawy dotyczą TRIMwsparcia w scenariuszach RAID. O ile mi wiadomo, mimo że upłynęło ponad 6 lat od wprowadzenia dysków SSD na komputery klasy konsumenckiej i 4 lata od momentu udostępnienia NVMe na rynku - współczesne kontrolery RAID nadal nie obsługują wydawania TRIMpoleceń na podłączonych dyskach SSD - z wyjątkiem kontrolerów RAID Intela w trybie RAID-0.

Dziwię się, że TRIMobsługa nie jest dostępna w trybie RAID-1, biorąc pod uwagę sposób, w jaki dyski się odbijają, wydaje się to proste. Ale dygresję.

Zwracam uwagę, że jeśli chcesz mieć odporność na awarie dysków (zarówno HDD, jak i SSD), użyłbyś ich w konfiguracji RAID - ale ponieważ dyski SSD nie byłyby wyposażone w TRIM, oznacza to, że ucierpiałyby na wzmocnieniu zapisu, co powoduje dodatkowe zużycie, które z kolei spowodowałoby przedwczesne awarie dysków SSD - jest to niefortunna ironia losu: system zaprojektowany w celu ochrony przed awarią dysku może doprowadzić do bezpośredniego skutku.

Więc:

  1. Czy TRIMwsparcie jest konieczne w przypadku nowoczesnych dysków SSD z epoki 2015-2016?

    1.1 Czy jest jakaś różnica w potrzebie TRIMobsługi dysków SSD SATA, SATA-Express i SSD opartych na NVMe?

  2. Często dyski są reklamowane jako ulepszone wbudowane funkcje usuwania śmieci; czy to eliminuje potrzebę TRIM? Jak działa ich proces GC w środowiskach RAID?

    1.1 Na przykład zobacz ten QA z 2010 roku, który opisuje dość zły spadek wydajności z powodu braku TRIMming ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) - i to artykuł z 2015 r. potwierdza, że ​​zdecydowanie zaleca się korzystanie z TRIM ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim -prawo / ). Jaka jest twoja odpowiedź na te mocne argumenty przemawiające za koniecznością TRIM?

  3. Wiele artykułów i dyskusji z wcześniejszych lat dotyczy SLC kontra MLC flash i że SLC jest lepsza ze względu na znacznie dłuższą żywotność - wydaje się jednak, że wszystkie dyski SSD (niezależnie od tego, gdzie znajdują się w spektrum od konsumenta do przedsiębiorstwa) to MLC tezy - czy to rozróżnienie ma już znaczenie?

    1.1 A co z flashem TLC?

  4. Dyski SSD dla przedsiębiorstw mają zwykle znacznie wyższe limity wytrzymałości / zapisu (często mierzone, ile razy można całkowicie nadpisać dysk w ciągu jednego dnia, przez przewidywany 5-letni okres użytkowania dysku) - jeśli ich limit cyklu zapisu jest bardzo wysoki (np. 100 pełnych zapisów dziennie) czy to oznacza, że ​​wcale nie potrzebują, TRIMponieważ limity te są tak wysokie, czy - wręcz przeciwnie - czy limity te można osiągnąć tylko przy użyciu TRIM?

Dai
źródło
6
Chociaż nie mogę odpowiedzieć na twoje pytanie, myślę, że należy to rozważyć w świetle faktu, że nasza branża stara się zabić zastrzeżoną macierz RAID, wszyscy dostawcy chmury publicznej korzystają teraz z dysków SSD w usługach obliczeniowych i pamięci masowej, z pewnością rozwiązali to z oprogramowaniem, kodowaniem wymazywania itp. Innowacje w dziedzinie przetwarzania w chmurze ujawniły takie elementy, jak sprzętowa macierz RAID, Cisco IOS i zastrzeżone sieci pamięci masowej, jako bezcelowe towary fermentujące na szczycie łańcucha żywnościowego i faktycznie hamujące innowacje. sprzętowej macierzy RAID nie można sprzedawać na dużą skalę (do AWS, Azure, CERN), więc ....
Sum1sAdmin
@ Sum1sAdminuj, że wszyscy dostawcy chmury publicznej używają teraz dysków SSD w usługach obliczeniowych i magazynowych. Mówisz, że AWS lub BlackBlaze przechowują dane tylko na dyskach SSD?
AL
@AL no nie, wskazuję tylko, że oferta SSD do przechowywania bloków, plików, obiektów i efemerycznych
Sum1sAdmin
Całkowicie nie zgadzam się z „różnicą jakościową” między reklamą a konsumentem. Zapewniam cię, że nie ma różnicy w produkcji NAND. Z pewnością istnieją różni producenci (Samsung vs Intel), ale żaden z nich nie ma specjalnego procesu produkcyjnego dla konsumentów. Z pewnością istnieją różnice funkcji, ale nie różnice w jakości.
Jim B
Mówiąc o Optane, jesteśmy prawie w połowie 2016 roku i nigdzie nie widać ... Czy ktoś wie, o co chodzi?
Jeff Meden

Odpowiedzi:

24

Spróbujmy odpowiedzieć na jedno pytanie na raz:

  • Czy obsługa TRIM jest niezbędna w przypadku nowoczesnych dysków SSD z epoki 2015-2016?

Krótka odpowiedź: w większości przypadków nie. Długa odpowiedź: jeśli zarezerwujesz wystarczającą ilość wolnego miejsca (~ 20%), nawet dysk klasy konsumenckiej zwykle ma całkiem dobre wartości spójności wydajności (ale musisz unikać dysków, które zamiast tego dławią się przy ciągłym zapisie). Dyski klasy korporacyjnej są jeszcze lepsze, zarówno dlatego, że mają domyślnie większą wolną przestrzeń, jak i dlatego, że ich kombinacja kontrolera / oprogramowania układowego jest zoptymalizowana pod kątem ciągłego użytkowania dysku. Na przykład spójrz na dysk S3700, do którego się odwołujesz: nawet bez przycinania ma bardzo dobrą spójność zapisu.

  • Często dyski są reklamowane jako mające ulepszone wbudowane zbieranie śmieci, czy to eliminuje potrzebę TRIM? Jak działa ich proces GC w środowiskach RAID

Śmieciarka napędowa wykonuje swoją magię wewnątrz piaskownicy dysku - nie wie nic o środowisku zewnętrznym. Oznacza to, że poziom RAID macierzy nie wpływa (głównie). To powiedziawszy, niektóre poziomy RAID (w zasadzie oparty na parzystości) mogą czasami (iw niektórych konkretnych implementacjach) zwiększać współczynnik wzmocnienia zapisu, co z kolei oznacza wyższą pracę dla procedur GC.

  • Wiele artykułów i dyskusji z wcześniejszych lat dotyczy SLC vs MLC flash i że SLC jest lepszy ze względu na znacznie dłuższą żywotność, jednak wydaje się, że wszystkie dyski SSD (niezależnie od tego, gdzie znajdują się w spektrum od konsumenta do przedsiębiorstwa) są tezami MLC - czy to rozróżnienie jest już istotne

Dyski SLC zasadniczo zniknęły z przedsiębiorstwa, przenosząc się głównie do zadań wojskowych i niektórych zadań przemysłowych. Oznaczone przedsiębiorstwo jest teraz podzielone na trzy kategorie:

  • Pamięć flash HMLC / MLCe to ta z lepszymi układami scalonymi MLC i certyfikowana na co najmniej 25000/30000 cykli przepisywania;
  • Chipy 3D MLC mają około 5000-10000 cykli przepisywania;
  • normalne płaskie układy MLC i 3D TLC są oceniane na około 3000 cykli przepisywania.

W rzeczywistości każdy z powyższych typów pamięci flash powinien zapewniać dużą całkowitą pojemność zapisu, aw rzeczywistości można znaleźć dyski dla przedsiębiorstw ze wszystkimi powyższymi typami pamięci flash.

Rzeczywiste rozróżnienie między dyskami dla przedsiębiorstw i konsumentów to:

  • kombinacja kontrolera / oprogramowania układowego, z dyskami korporacyjnymi znacznie trudniej umrzeć z powodu nieoczekiwanego błędu kontrolera;
  • chroniona przed zapisem pamięć podręczna zapisu, niezwykle ważna dla uniknięcia uszkodzenia Flash Translation Layer (FTL), która jest przechowywana w samej pamięci flash.

Sterowniki klasy korporacyjnej są lepsze głównie ze względu na kontrolery i kondensatory mocy, a nie ze względu na lepszą pamięć flash.

  • Dyski SSD dla przedsiębiorstw mają zwykle znacznie wyższe limity wytrzymałości / zapisu (często mierzone, ile razy można całkowicie nadpisać dysk w ciągu jednego dnia, w ciągu oczekiwanego 5-letniego okresu użytkowania dysku), czy to eliminuje wszelkie obawy związane ze wzmocnieniem zapisu spowodowanym przez nie działa TRIM?

Jak wspomniano powyżej, dyski klasy korporacyjnej mają znacznie większą domyślną wolną przestrzeń (~ 20%), co z kolei drastycznie zmniejsza potrzebę regularnych TRIM

W każdym razie, na marginesie, rozważ niektóre programowe macierze RAID, które obsługują TRIM (ktoś powiedział, że Linux MDRAID? )

Shodanshok
źródło
Tylko 35000 cykli zapisu ?! To nie brzmi jak bardzo wiele. Wydaje mi się, że ma to sens, jeśli zwiększenie wymiany dysków jest tańsze niż zakup takiej samej pojemności w SLC.
user253751
~ 30000 minimalnych gwarantowanych cykli przepisywania nie jest niczym złym: dzięki zwiększonej wydajności przełącznika na NAND 2-bit-na-komórkę dyski MLC są znacznie tańsze niż SLC, przy zachowaniu podobnej wytrzymałości. Co więcej, dni, w których ogniwa SLC klasy 50 nm oceniono na> 100000 cykli przepisywania, już minęły: nawet dyski firmowe mają pamięć flash klasy 34 / 25nm (lub mniejszą), z wewnętrznie niższą wytrzymałością (co również wpływa na dyski SLC).
shodanshok
@shodanshok Twój wniosek brzmi: „Używaj dysków SSD klasy korporacyjnej (SAS) podłączonych do zwykłego kontrolera RAID i nie martw się o to” - i że nie zobaczę spadku wydajności w ciągu 5 lat, dla których dysk jest gwarantowany? I że problemy z wydajnością udokumentowane przez innych użytkowników dotyczą tylko dysków klasy konsumenckiej?
Dai
@Dai dla dysków „klasy korporacyjnej” Nie mam na myśli tylko dysków SSD SAS, a raczej wybrane dyski SSD SATA można uznać za „klasy korporacyjnej”. I tak, dyski dla przedsiębiorstw mają bardzo dobrą spójność wydajności, nawet w stanie ustalonym (tzn. Całkowicie zapełnionym). Przykład takich napędów znajduje się tutaj . Nawet niektóre dyski konsumenckie, w połączeniu z hojną nadwyżką, mogą być dość spójne. Zobacz tutaj przykład.
shodanshok
1
Binning to proces polegający na sprawdzaniu i grupowaniu chipów krzemowych na podstawie ich jakości. Tak więc układy MLC NAND dla przedsiębiorstw są w zasadzie „lepiej wykonanymi”, lepiej przetestowanymi układami.
shodanshok
9

TRIM nie jest czymś, o co martwię się, kiedy używam dysków SSD w nowoczesnych kontrolerach RAID. Dyski SSD zostały ulepszone, funkcje kontrolera sprzętowego RAID zostały zoptymalizowane pod kątem tych obciążeń, a raportowanie wytrzymałości zwykle jest dostępne.

TRIM jest przeznaczony dla niższych dysków SATA. W przypadku dysków SSD SAS mamy mapowanie SCSI i być może dlatego nie spełniam potrzeb TRIM ...

Ale drugi komentator ma rację. Software-Defined Storage (SDS) zmienia sposób korzystania z dysków SSD. W rozwiązaniach SDS kontrolery RAID są nieistotne. A rzeczy takie jak TRIM są zwykle mniej ważne, ponieważ dyski SSD pełnią określone role. Myślę o pamięci podręcznej odczytu pamięci Nimble lub ZFS L2ARC i ZIL ... Wszystkie one spełniają określone potrzeby, a oprogramowanie inteligentniej wykorzystuje zasoby.

ewwhite
źródło
3
UNMAP i TRIM robią dokładnie to samo.
Michael Hampton
2
Trim / unmap jest zawsze wymagane - bez niego musiałbyś całkowicie polegać na wewnętrznym zbieraniu śmieci
Jim B
Wewnętrzne zbieranie pamięci nie zastępuje TRIM. Nie ma funkcji oprogramowania układowego, która zastąpiłaby działanie TRIM. To trochę niepokojące, więc wiele odpowiedzi tutaj nie rozumie, co tak naprawdę robi TRIM i dlaczego jest potrzebne. Zapoznaj się z artykułami takimi jak ten arstechnica.com/gadgets/2015/04/…
Shiv
1

Poziomy RAID z dyskiem SSD Powyższa odpowiedź sugeruje, że poziomy RAID z parzystością, takie jak RAID 5, zwiększają wzmocnienie zapisu. Jest naprawdę więcej niż jeden sposób, aby to zinterpretować: wpływ na jeden dysk lub wpływ na zestaw dysków.

W porównaniu do braku nadmiarowości, RAID 5 dodaje zapisy do zestawu, ponieważ dodaje parzystość sumy kontrolnej. W porównaniu do macierzy RAID 0 (n-1), wpływ macierzy RAID 5 na n-dysków na dysk jest niczym. Każdy z n napędów otrzymuje tyle samo zapisów. RAID 5 dodaje 1 / (n-1) dodatkowe zapisy do zestawu. RAID 1 i RAID 10 dodają jednak 100% dodatkowych zapisów do zestawu, ponieważ wszystko zapisane na jednym dysku SSD jest zapisywane w lustrze.

Pod względem zapisu do zestawu RAID 5 w porównaniu do zestawu RAID 10 z taką samą liczbą dysków, dyski SSD w zestawie RAID 5 otrzymają mniej zapisów. I to pozostaje prawdą, nawet jeśli zwiększysz liczbę dysków SSD w zestawie RAID 10, aby wyrównać pojemność użyteczną.

Keith J.
źródło
0

Shodanshok dotknął tutaj prawdziwej odpowiedzi. Jeśli zarezerwujesz dodatkową przestrzeń, „nadmierne przydzielanie”, wytrzymałość dysku SSD i spójność wydajności zapisu z czasem ulegną poprawie, a brak obsługi TRIM staje się w większości nieistotny. Zastrzeżenie tej dodatkowej przestrzeni można zrobić tak prosto, jak, zaczynając od nowego dysku SSD, partycjonując mniej niż pełną pojemność. Większość kontrolerów napędu traktuje nigdy nieużywaną przestrzeń tak samo, jak przestrzeń zarezerwowaną, a tym samym znacznie zmniejsza wzmocnienie zapisu. W przypadku rozruchu i systemu operacyjnego prawdopodobnie 10% zarezerwowanego miejsca jest wystarczające. W przypadku dysków, które są często przepisywane, zwiększ to miejsce.

Keith J.
źródło