Samsung SSD „Wear_Leveling_Count” oznacza

26

Mam dyski Samsung SSD na własnym laptopie i niektórych serwerach.

Kiedy robię:

smartctl -a /dev/sda | grep 177

Otrzymuję wyniki, których nie rozumiem. Oto kilka przykładów:

# my laptop Samsung SSD 850 EVO 500GB (new)
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count     0x0013   100   100   000    Pre-fail  Always       -       0

# server 256 GB, SAMSUNG MZ7TE256HMHP-00000
177 Wear_Leveling_Count     0x0013   095   095   000    Pre-fail  Always       -       95

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (1 year old)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (suppose to be new)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 480 GB, SAMSUNG MZ7KM480HAHP-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       3

# server 240 GB, SAMSUNG MZ7KM240HAGR-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       11

Masz pomysł, jak czytać Wear_Leveling_Count?

Niektóre wartości są minimalne, niektóre maksymalne.

Jeśli weźmiemy pod uwagę „laptop” Samsung SSD 850 EVO 500GB, jest to 0 i prawdopodobnie przejdzie do 100, a następnie zawiedzie.

Jeśli weźmiesz pod uwagę pierwszy „serwer” 256 GB, SAMSUNG MZ7TE256HMHP-00000, to jest już na maksimum? Czy spadnie do zera?

Nacięcie
źródło

Odpowiedzi:

43

Kingston opisuje ten atrybut SMART w następujący sposób:

Średnia liczba cykli kasowania / programu na blok. Ten atrybut ma być wskaźnikiem bezpośredniego zużycia. Znormalizowane równanie: 100 - (100 * Średnia liczba wymazywań / NAND maksymalna liczba cykli wymazywania)

Zignoruj Raw Datate przypadki (producenci mogą nimi manipulować, aby działali na różne sposoby) i spójrz na Current Valuekolumnę.

To źródło z Anandtech daje nam dobre wskazówki, jak korzystać z tej liczby:

Wartość SMART zliczania zużycia (WLC) zapewnia nam wszystkie potrzebne dane. Bieżąca wartość oznacza pozostałą wytrzymałość dysku w procentach, co oznacza, że ​​zaczyna się on od 100 i zmniejsza liniowo w miarę zapisywania na dysku. Surowa wartość WLC zlicza zużyte cykle P / E, więc jeśli te dwie wartości są monitorowane podczas zapisywania na dysku, wcześniej niż później znajdziemy miejsce, w którym znormalizowana wartość spada o jeden.

Wszystkie napędy są w temperaturze pomiędzy 95 i 100, a ostatecznie spaść do 0. To jest oszacowanie, ile write, erase, rewriteitp cykle każdy blok może przejść przed braku, a w tej chwili jeden z dysków jest szacowana na wykorzystał 5% jego bieżącej oczekiwanej żywotności. Znów słowo kluczowe jest tutaj szacowane.

Należy również pamiętać, że dyski mogą korzystać z różnych technologii NAND, stąd różnice w postrzeganym życiu. Niektóre technologie NAND oczekują, że bloki będą działać przez około 1000 cykli PE każdy, inne można oszacować nawet na 30 000.

Jonno
źródło
Dołączyłem tabelę „nagłówek”. Co to jest „aktualna” wartość? czy to kolumna „WARTOŚĆ”?
Nick
@Nick Tak, dokładnie.
Jonno
To dokładne przeciwieństwo mojego doświadczenia. Moje nowe dyski (Samsung 850 Pro, Samsung 840 Pro) zaczęły od wartości początkowej 0 i od tego momentu wzrosły. W rzeczywistości mój obecny 840 Pro miał 97 lat około miesiąca temu, a teraz 99. (To z patrzenia na dane SMART za pomocą oprogramowania Samsung Magician.)
Granger
3
@Granger Czy masz kolumnę „Wartość” lub „Bieżąca”? Surowe wartości zazwyczaj zależą od producenta OEM i decydują, co z nimi zrobić, i niekoniecznie są to czytelne dane. Zauważ, że w podanym przykładzie PO „WARTOŚĆ” wynosi 100, a „RAW_VALUE” wynosi 0 dla ich 850 EVO.
Jonno
Ach Ma to większy sens, jeśli całkowicie zignoruję kolumnę „Surowa wartość”.
Granger,
2

SMART zgłasza WSTĘPNY warunek mojego telefonu Samsung SM951 (AHCI) 128 GB, zgłoszony w systemie Linux jako SAMSUNG MZHPV128HDGM-00000 (BXW2500Q).

Ale w moim przypadku myślę, że to błąd oprogramowania wewnętrznego napędu,

  • ponieważ total-bytes-writtenwłaściwość jest zgłaszana jako 1,1 TB, podczas gdy dysk ma określoną całkowitą liczbę zapisanych bajtów (TBW) wynoszącą 75 TB! Co prawdopodobnie jest po (bardzo) stronie oszczędzania, ponieważ wszystkie podobne (MLC NAND) dyski osiągnęły wiele takich (600 TB) w prawdziwym teście wytrzymałościowym ,
  • a poza wear_level_countostrzeżeniem nie są zgłaszane żadne inne błędy przedwstępne lub starsze lub ostrzeżenia,
  • podczas gdy reallocated-sector-count, który zgodnie z tym testem jest dobrym wskaźnikiem stanu przed awarią, nadal wynosi 0.

Radzę więc zbadać te wartości dla twojego napędu / systemu i oprzeć na tym swoje wnioski.

Wolę skdumpdołączone narzędzie niskiego poziomu libatasmart, tę samą bibliotekę, która jest używana przez dyski Gnome .

Użyj następującego polecenia, zastępując /dev/sdcścieżkę do urządzenia blokowego:

sudo skdump /dev/sdc

Ronald
źródło