Czy moduły pamięci ECC są ważne na niekrytycznym serwerze?
Myślałam o tym, aby stać się serwerem dedykowanym do zabawek dla wielu przypadkowych, niekrytycznych rzeczy. Sporadyczne restarty nie są niczym wielkim. Patrzę na jednego dostawcę, ale ceny są niesamowicie tanie. Ich sprzęt brzmi jak żart dla każdego poważnego serwera: procesory do komputerów stacjonarnych, pamięć RAM bez ECC, obudowa bez nazwy, brak dysku twardego SATA HDD itp. (Cóż, cena uzasadnia, jak sądzę).
Biorę pamięć ECC za pewnik na jakimkolwiek „poważnym” serwerze, więc zastanawiam się, czy to wielka sprawa, czy nie dla „zabawkowych” urządzeń.
Odpowiedzi:
Dane opublikowane przez pracowników IT CERN ( integralność danych ) sugerują, że liczba błędów pochodzących z pamięci RAM jest dość niska. Nadal musisz zważyć swoje dane i koszt sprzętu.
Możesz przeczytać więcej na ten temat w StorageMojo .
źródło
Pamięć ECC RAM zasadniczo pomaga zapobiegać błędom występującym podczas odczytu i zapisu z pamięci RAM. Prawdopodobieństwo wystąpienia błędu jest dość małe, ale niezerowe. Powiedziałbym, że jeśli nie robisz rzeczy o kluczowym znaczeniu dla misji, możesz uciec bez pamięci RAM ECC - tak jak powiedziałem, szanse na napotkanie błędu, któremu ECC by zapobiec, są naprawdę bardzo małe.
źródło
Co to jest niekrytyczny serwer? Który może zawieść?
Pamięć ECC RAM ma fundamentalne znaczenie, gdy niezawodność pamięci ma fundamentalne znaczenie.
Wraz ze wzrostem wielkości pamięci rosną dwie rzeczy:
Ta prezentacja wywiadu na temat ECC podaje następujące fakty:
Inne ostatnie badania przeprowadzone przez WISC pokazują, że ECC jest niezbędne dla tych systemów ZFS:
Należy zauważyć, że inne systemy plików są tak samo wrażliwe na tę formę uszkodzenia danych, jak ZFS.
ECC jest tym, co ratuje cię od napotkania tych problemów, gdy jest to możliwe, aw katastrofalnych przypadkach, co ostrzega cię przed tym, zanim będzie za późno.
źródło
To po prostu nie jest takie ważne. Gdybyś potrzebował 99,999% czasu sprawności, martwiłbyś się tym. Poza tym będziesz restartować częściej niż błędy pamięci.
źródło
To badanie przeprowadzone przez Google z 2009 znalezionych poziom błędu między 25000 a 70000 błędów na miliard godzin urządzeń za megabit. Oznacza to, że dla 8GiB (używanej) pamięci RAM występowało około 1,7 do 4,8 błędów na godzinę.
Bitflipy to coś, co istnieje i nie powinno być ignorowane, gdy tylko ważna jest integralność danych.
W twoim przypadku (losowe, niekrytyczne rzeczy) byłoby to prawdopodobnie przesada.
źródło