Czy dyski SSD są tak niezawodne jak dyski mechaniczne (2013)?

162

Dyski SSD istnieją już od kilku lat. Ale wciąż pojawia się kwestia niezawodności.

Wydaje mi się, że jest to kontynuacja pytania zadanego 4 lata temu i ostatnio zaktualizowanego w 2011 roku. Teraz jest 2013, czy wiele się zmieniło? Chyba szukam prawdziwych dowodów, czegoś więcej niż tylko przeczucie. Może używasz ich w swoim DC. Jakie było twoje doświadczenie?

Niezawodność dysków SSD


AKTUALIZACJA:

Jest teraz 2016. Myślę, że odpowiedź brzmi prawdopodobnie tak (szkoda, że ​​wciąż kosztują więcej za GB).

Ten raport zawiera pewne dowody:

Niezawodność flash w produkcji: oczekiwane i nieoczekiwane

I kilka interesujących danych na temat (mechanicznych) napędów mechanicznych:

Backblaze: dane i statystyki dysku twardego

Matt
źródło
2
Dlaczego mówisz, że wciąż pojawia się problem z niezawodnością?
ewwhite
6
Dysk SSD laptopa mojej żony przestaje działać co kilka miesięcy i wymaga dziwnej poprawki „włączania, ale nie próbuj uruchamiać się przez dwadzieścia minut”. Potem znowu jest w porządku. Nowa technologia, nowe sposoby na porażkę.
Jaydee
3
Tylko jeden punkt danych, obawiam się: dostałem MacBooka Retina Pro we wrześniu ubiegłego roku i miałem awarię terminala SSD w ciągu 60 dni. Jednostka zamienna była w porządku, ale teraz jestem bardzo ostrożny, ponieważ wymiana / uaktualnienia przez użytkowników nie są tak naprawdę opcją.
Roddy
27
I tak nie chcesz niezawodnego napędu. Jeśli zawiedzie każdego dnia o godzinie 14:00, będziesz mógł polegać na ustawieniu zegarka. To, czego chcesz, to sprężysty dysk.
Alan B
3
Dyski SSD są od wielu dłużej niż „kilka lat”. W rzeczywistości więcej niż 40, a nawet jeśli masz na myśli dyski SSD z pamięcią flash, rozmawiamy prawie o 20 latach.
alastair

Odpowiedzi:

175

Będzie to zależało od obciążenia i klasy zakupionego dysku ...

W moich wdrożeniach serwera nie miałem poprawnie określonego błędu SSD. Dotyczy to wielu różnych rodzajów dysków, aplikacji i obciążeń.

Pamiętaj, że nie wszystkie dyski SSD są takie same !!

Co więc oznacza „właściwie określona” ?

Jeśli Twoje pytanie dotyczy użycia dysków SSD w aplikacjach korporacyjnych i serwerowych, w ciągu ostatnich kilku lat wiele się zmieniło od czasu pierwotnego pytania . Oto kilka rzeczy do rozważenia:

  • Zidentyfikuj swój przypadek użycia: istnieją dyski konsumenckie, dyski dla przedsiębiorstw, a nawet wytrzymałe dyski SSD do zastosowań przemysłowych . Nie kupuj taniego dysku przeznaczonego do użytku na komputerze i nie uruchamiaj na nim bazy danych intensywnie zapisującej.

  • Dostępnych jest wiele elementów: dzisiejsze dyski SSD można znaleźć w kartach PCIe, SATA i SAS 1,8 ", 2,5", 3,5 "i innych wariantach.

  • Użyj RAID dla swoich serwerów: nie będziesz zależał od pojedynczego napędu mechanicznego w sytuacji serwera. Dlaczego zrobiłbyś to samo dla dysku SSD?

  • Skład napędu: Istnieją dyski SSD oparte na pamięci DRAM, a także typy pamięci flash MLC, eMLC i SLC. Te ostatnie mają skończone czasy życia, ale są dobrze zdefiniowane przez producenta. np. zobaczysz dzienne limity zapisu, takie jak 5 TB / dzień przez 3 lata .

  • Aplikacja napędu ma znaczenie: niektóre dyski są do ogólnego użytku, a inne są zoptymalizowane pod kątem odczytu lub zapisu. Dyski oparte na pamięci DRAM, takie jak sTec ZeusRAM i DDRDrive , nie ulegają zużyciu. Idealnie nadają się do środowisk o dużym zapisie i do wolniejszych dysków z przodu. Dyski MLC są zwykle większe i zoptymalizowane do odczytu. Dyski SLC mają dłuższą żywotność niż dyski MLC, ale MLC dla przedsiębiorstw wydaje się być wystarczająco dobre dla większości scenariuszy.

  • TRIM nie wydaje się mieć znaczenia: sprzętowe kontrolery RAID nadal nie obsługują go w pełni . Przez większość czasu używam dysków SSD, będzie to sprzętowa konfiguracja RAID. Nie martwię się o to w moich instalacjach. Może powinienem?

  • Wytrzymałość: Nadmiarowe przydzielanie jest powszechne w dyskach SSD klasy serwerowej. Czasami można to zrobić na poziomie oprogramowania układowego lub po prostu partycjonując dysk we właściwy sposób. Algorytmy wyrównywania zużycia są również lepsze we wszystkich obszarach. Niektóre dyski zgłaszają nawet statystyki dotyczące żywotności i wytrzymałości. Na przykład niektóre z moich firmowych dysków SSD Sandisk marki HP pokazują się 98% life remainingpo dwóch latach użytkowania.

  • Ceny znacznie spadły: dyski SSD osiągnęły odpowiedni stosunek ceny do wydajności dla wielu aplikacji. Gdy wydajność jest naprawdę potrzebna, obecnie rzadko stosuje się napędy mechaniczne.

  • Reputacja została ugruntowana: np. Intel jest bezpieczny, ale nie ma wysokiej wydajności. OCZ jest zawodny. Dyski oparte na Sandforce są dobre. sTec / STEC jest wyjątkowo solidny i jest producentem OEM wielu dysków klasy high-end. Sandisk / Pliant jest podobny. OWC ma świetne rozwiązania SSD ze znakomitą gwarancją na serwery o niskim wpływie oraz na stanowiska robocze / do laptopów.

  • Ochrona przed utratą zasilania jest ważna: spójrz na dyski z superkondensatorami / superkondensatorami, aby poradzić sobie z wyjątkowymi zapisami podczas awarii zasilania. Niektóre napędy zwiększają wydajność dzięki wbudowanym pamięciom podręcznym lub wykorzystują je w celu zmniejszenia zużycia. Supercaps zapewniają, że zapisy są opróżniane do stabilnego przechowywania.

  • Rozwiązania hybrydowe: dostawcy sprzętowych kontrolerów RAID oferują możliwość rozszerzenia standardowych macierzy dyskowych o dyski SSD w celu przyspieszenia odczytu / zapisu lub pełnienia funkcji inteligentnej pamięci podręcznej. LSI ma CacheCade i swoją ofertę sprzętu / oprogramowania Nytro . Istnieją również rozwiązania na poziomie oprogramowania i systemu operacyjnego, takie jak lokalne buforowanie aplikacji, baz danych lub systemów hypervisor. Zaawansowane systemy plików, takie jak ZFS, bardzo inteligentnie wykorzystują dyski SSD zoptymalizowane do odczytu i zapisu; ZFS można skonfigurować tak, aby korzystał z oddzielnych urządzeń do buforowania wtórnego i dziennika zamiarów, a dyski SSD są często używane w tej pojemności nawet w przypadku pul dysków HDD.

  • Nadszedł czas na najwyższy poziom pamięci flash: rozwiązania pamięci flash PCIe, takie jak FusionIO, osiągnęły dojrzałość do tego stopnia, że ​​organizacje mogą wygodnie wdrażać krytyczne aplikacje, które polegają na zwiększonej wydajności. Rozwiązania dla urządzeń i sieci SAN, takie jak RanSan i pamięć skrzypiec, są nadal dostępne, a więcej osób wchodzi w tę przestrzeń.

wprowadź opis zdjęcia tutaj

ewwhite
źródło
12
TRIM jest naprawdę ważny w przypadku dysków z bardzo niewielką nadmiarową obsługą administracyjną, co jest zwykłym przypadkiem w przypadku dysków konsumenckich, w których $ / GB jest najważniejsze. Większość dysków korporacyjnych ma wystarczającą nadmiarową obsługę administracyjną, aby TRIM nie miało znaczenia.
Pan Alpha
2
@MisterSmith Zobacz, co napisałem powyżej. Różne dyski SSD mają różne cechy. Użyj odpowiedniego narzędzia do pracy. Gdybym wziął dysk Corsair lub inny dysk dla konsumenta i używał go jako dysku SSD dla aktywnego systemu bazy danych o dużym obciążeniu zapisu lub jako urządzenia rejestrującego ZIL dla macierzy pamięci ZFS, spaliłbym go za miesiąc lub dwa .
ewwhite
1
Doskonały post. Jedno moje wkurzenie: kontrolery RAID nie zawsze są właściwym wyborem dla dysków SSD. Kontrolery RAID zostały zaprojektowane do usuwania danych i dodawania kodów korekcji błędów na wielu dyskach magnetycznych. Kontrolery SSD już natywnie pasują dane i dodają kody korekcji błędów w wielu bankach NVRAM. Ponadto dodanie kontrolera RAID wprowadza jeden dodatkowy SPOF, sam kontroler RAID. Korzystanie oddzielny kontroler RAID jest często dobrym wyborem, ale czasami za pomocą lepszego SSD (wyższy stopień SATA / SAS lub nawet karty PCI-E jak Fusion-IO) jest lepszym wyborem.
Jesper Mortensen
5
@ rickyduck, W rzeczywistości w centrum danych awaria pojedynczego dysku jest chroniona przez RAID i oznacza wyrzucenie kilku $$$, aby zastąpić go bez przestojów; podczas gdy w urządzeniu do gier wadą pojedynczego dysku jest całkowita utrata danych i ponowna instalacja systemu operacyjnego.
2
@MisterSmith nawet wysokiej klasy dyski SSD do komputerów stacjonarnych są tańsze na GB niż dyski przeznaczone do typowych zastosowań w centrum danych. Oprócz bardziej wydajnych kontrolerów w niektórych przypadkach (lub po prostu oprogramowania układowego o niskim wolumenie dostosowanego pod kątem przepustowości zamiast wydajności seryjnej), uzyskują one najlepszą pamięć flash od góry produkcji, ponieważ wiele obciążeń serwera jest o rząd wielkości o wiele więcej operacji IO niż komputerów stacjonarnych dyski i szybko zabiłby dysk klienta.
Dan Neely
59

Każdy laptop w mojej pracy ma dyski SSD lub hybrydowe od 2009 roku. Podsumowanie moich doświadczeń z dyskami SSD:

  • Dyski nazywane przeze mnie „pierwszą generacją”, sprzedawane głównie około 2009 r .:
    • W pierwszym roku zmarło około 1/4, prawie wszystkie z powodu syndromu nagłej śmierci (SSD - to zabawne, śmiech). Było to bardzo zauważalne dla użytkowników końcowych i denerwujące, ale drastyczna różnica prędkości sprawiła, że ​​ten ciągły wzór awarii jest tolerowany.
    • Po 3 latach wszystkie dyski zginęły (nagła śmierć lub zużycie), z wyjątkiem dwóch, którzy wciąż kopią (obecnie dyski L2Arc na serwerze).
  • Dyski „drugiej generacji”, sprzedawane około roku 2010-11, różnią się od poprzedniej generacji, ponieważ ich wskaźnik Syndromu Nagłej Śmierci gwałtownie spadł. „Problem” zużycia nadal występował.
    • Po pierwszym roku większość dysków nadal działała. Było kilka Nagłych Zgonów. Kilka nie udało się zużyć.
    • Po 2-3 latach kilka więcej niż połowa nadal pracuje. Wskaźnik niepowodzenia w pierwszym roku zasadniczo się utrzymał.
  • Dyski „trzeciej generacji”, sprzedawane w wersji 2012+, nadal działają.
    • Po pierwszym roku wszystko nadal działa (puka do drewna).
    • Najstarszy dysk, jaki mam, pochodzi z marca 2012 roku, więc nie ma jeszcze 2-3 lat danych.

Awaria SSD (skumulowana)


Aktualizacja z maja 2014 r .:
Kilka dysków „drugiej generacji” uległo awarii, ale około jedna trzecia oryginalnych dysków nadal działa. Wszystkie dyski „trzeciej generacji” z powyższej grafiki nadal działają (powalają na drewno). Słyszałem podobne historie od innych, ale wciąż niosą to samo ostrzeżenie o śmierci na szybkich skrzydłach . Czujność będzie dobrze tworzyć kopie zapasowe swoich danych.

Chris S.
źródło
2
Moje doświadczenie to odzwierciedla. To powiedziawszy, nadal zapewniamy pracownikom dyski twarde USB do wykorzystania jako kopie zapasowe wehikułu czasu (oprócz naszego standardowego schematu tworzenia kopii zapasowych poza siedzibą), aby umożliwić szybkie, szczegółowe przywracanie w przypadku katastrofalnej awarii lub utraty.
EEAA
22
Daj trzeciej generacji kolejny rok lub dwa. ;)
Andy
7
Warto również zauważyć, że dyski SSD są znacznie bardziej narażone na błędy w oprogramowaniu niż dyski HDD; oprogramowanie układowe jest zarówno bardziej skomplikowane, jak i mniej dojrzałe, co nie jest dobrym połączeniem.
alastair
2
@Andy ma rację. Od 2009 roku mówisz, że okres półtrwania wynosił około roku. W latach 2010–2011 mamy obecnie zaledwie 3 lata, aby osiągnąć środek tego przedziału, w którym wskazujesz okres półtrwania wynoszący 3 lata. Może to opierać się tylko na bieżących obserwacjach. To, czy okres półtrwania dla dysków 2012 i 2013 poprawił się ponad 3 lata, tak naprawdę nie może być znane przynajmniej do 2016 r. (Możemy spróbować ekstrapolować z wczesnych awarii, ale prawdopodobnie byłyby to po prostu pojedyncze wady produkcyjne, niepowodowane długim -termiczne regularne stosowanie.)
Andrew Vit
1
Używam 2 x Intel X25M 80Gb G1 od 2010 roku. Moja praca wymaga intensywnych procesów odczytu / zapisu. Co kilka miesięcy resetuję dysk (nie muszę), aby przywrócić wydajność, ale w przeciwnym razie zero problemów. W zeszłym roku dodałem 256 GB Samsung 230. Jak dotąd żadnych problemów!
Antillar Maximus
18

Z mojego doświadczenia wynika, że ​​prawdziwym problemem są umierające kontrolery, a nie sama pamięć flash. Zainstalowałem około 10 dysków SSD Samsunga (830, 840 [nie pro]) i żaden z nich jak dotąd nie spowodował żadnych problemów. Przeciwieństwo to dyski z kontrolerami Sandforce, miałem kilka problemów z dyskami zwinności OCZ, szczególnie zawiesza się w nieregularnych odstępach czasu, gdzie dysk przestaje działać do momentu wyłączenia zasilania / -pod komputerem. Mogę dać ci dwie rady:

  1. Jeśli potrzebujesz wysokiej niezawodności, wybierz dysk z MLC, lepiej SLC flash. Samsung 840 fe ma flash TLC i krótką gwarancję, myślę, że nie bez powodu;)

  2. Wybierz dysk z kontrolerem, o którym wiadomo, że jest stabilny.

klingt.net
źródło
Przypomina mi umierające kontrolery na obecnym oświetleniu LED. Diody LED działają bardzo długo, ale wydaje się, że kontrolery nie.
Matt
1
Kto wie, ale może to część przestarzałego przemysłu :)
klingt.net
11

www.hardware.fr jedna z największych francuskich serwisów informacyjnych o sprzęcie jest partnerem www.ldlc.com, jednego z największych francuskich sprzedawców online. Mają dostęp do statystyk zwrotów i od 2009 roku publikują raporty o awaryjności (płyty główne, zasilacze, RAM, karty graficzne, HDD, SSD, ...) dwa razy w roku.

Są to statystyki „wczesnej śmierci”, od 6 miesięcy do 1 roku użytkowania. Nie można również liczyć zwrotów bezpośrednio do producenta, ale większość osób wraca do sprzedawcy w pierwszym roku i nie powinno to wpływać na porównania marek i modeli.

Ogólnie mówiąc, wskaźniki awarii dysków twardych mają mniejsze różnice między markami i modelami. Zasadą jest większa pojemność> więcej talerzy> wyższy wskaźnik awaryjności, ale nic dramatycznego.

Wskaźnik awaryjności dysków SSD jest ogólnie niższy, ale niektóre modele dysków SSD były naprawdę złe z około 50% zwrotami w przypadku niesławnych w okresie, o który prosiłeś (2013). Wygląda na to, że przestał już kupować tę niesławną markę.

Niektóre marki SSD „optymalizują” swoje oprogramowanie wewnętrzne, aby uzyskać nieco wyższe wyniki w testach porównawczych, a czasami kończy się to zawieszaniem się, niebieskimi ekranami ... To także wydaje się mniejszym problemem niż w 2013 roku.

Raporty dotyczące wskaźników awaryjności są tutaj:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1) )
2016 (2)

Sacha K.
źródło
Oto link do automatycznie przetłumaczonej wersji francuskiego artykułu translate.googleusercontent.com/…
SDwarfs