Powiedziano mi, aby zaakceptować jeden błąd w Memtest86 +

52

Kupiłem nowy komputer w sierpniu z pamięcią RAM 4x4 GB. Miałem problemy z pamięcią RAM. Wysłali mi cztery nowe patyczki, które również generowały błędy. Wyróżniłem cztery drążki (z ośmiu, które miałem teraz), które nie generowały żadnych błędów. Odkryty przez przypadek nowy błąd pamięci RAM w zeszłym tygodniu (tym razem brak BSOD). Skontaktuj się z firmą. Według nich wystąpiły problemy ze złym stadem z zeszłego lata, więc przesłano mi dwa przetestowane dyski o pojemności 8 GB. Przez weekend działałem Memtest86 +. Po 20 godzinach dostałem błąd (patrz załączone zdjęcie). Test działa już od 37 godzin, ale jak dotąd tylko ten jeden błąd. Skontaktowałem się z firmą, w której kupiłem komputer. Odpisali:

Nie martwiłbym się niepowodzeniem.

Mieliśmy tutaj podobne sytuacje, w których mija wiele razy, ale raz kończy się niepowodzeniem. Uważamy, że jest to problem z memtestem, po tym, jak cała pamięć jest uszkodzona lub nie jest tak, że naprawdę nie możesz jej przepuścić kilka razy, następnym razem zawieść, a następnie przekazać ponownie!

Zaufaj mi w tej sprawie i kontynuuj pamięć, którą ci wysłaliśmy, a jeśli problemy będą się powtarzać, postaramy się ją wymienić.

Z innych postów na forum dowiaduję się, że wiele osób nie akceptuje ani jednego błędu. Co może oznaczać ten pojedynczy błąd, wadliwa pamięć RAM lub usterka w programie MEMTEST (lub innym)?

Aktualizacja: z pomocnych komentarzy poniżej stwierdzam, że może wystąpić sporadyczny (i rzadki) „losowy” błąd, który może być akceptowalny, ale powtarzające się błędy pod tym samym adresem mogą wskazywać na awarię. Memtest działa teraz przez 45 godzin i nadal mam tylko jeden błąd. Dla informacji wszystkich będę nadal przeprowadzać test. Za mniej niż dwa dni wyjeżdżam na miesiąc. Najprawdopodobniej zostawię Memtest uruchomiony. Ponieważ nie mam zasilacza UPS, istnieje ryzyko, że przerwa w zasilaniu zrujnuje eksperyment. Komputer jest pulpitem, więc nie mogę zabrać go ze sobą (co, co ciekawe, wystawiłbym go na działanie promieni kosmicznych podczas lotu;)).

Memtest

DustByte
źródło
+1; Osobiście uważam, że to świetne pytanie, przepraszam, że nie mogę pomóc z odpowiedzią. Lekko zaktualizowałem twoje pytanie, aby mieć pewność, że nie jest to poza tematem!
Dave
19
Ja osobiście nie przejmowałbym się jednym, i tylko jednym, niepowodzeniem ... bez korekcji błędów RAM może czasami mieć problem, nie jest idealny. Teraz, jeśli możesz powielić to pod tym samym zakresem adresów, oznacza to, że coś jest nie tak.
Shinrai
To całkiem proste. Zgłoszony błąd oznacza, że ​​pamięć nie ma poprawnej wartości pod tym adresem
Ramhound
4
Czy jesteś pewien, że to nie twój komputer uszkadza twojego barana?
sanny Sin
5
Zgadzam się z @Shinrai - gdyby nie były sporadyczne usterki z normalną pamięcią RAM, nie byłoby rynku na poprawianie błędów RAM . Powtarzające się błędy pod tym samym adresem to inna sprawa, która wskazywałaby na wadliwą komórkę pamięci.
jg-faustus

Odpowiedzi:

41

Prosto od autora Memtest86. Popchnęłbym ich, aby go zastąpić. Naprawdę nie powinno być żadnych błędów.

Jeśli masz stosunkowo niewielką liczbę adresów błędnych i tylko jeden lub dwa bity błędu, możesz być pewien, że błędy są prawidłowe. Również sporadyczne błędy są bez wyjątku ważne. Często dostawcy pamięci pytają, czy Memtest86 obsługuje ich konkretny typ pamięci lub mikroukład. Memtest86 jest zaprojektowany do pracy ze wszystkimi typami pamięci i wszystkimi chipsetami.

Wszystkie prawidłowe błędy pamięci powinny zostać poprawione. Możliwe jest, że określony błąd nigdy nie pojawi się podczas normalnej pracy. Jednak praca z marginalną pamięcią jest ryzykowna i może spowodować utratę danych, a nawet uszkodzenie dysku. Nawet jeśli nie ma jawnego wskazania problemów, nie można założyć, że system nie ma wpływu. Czasami sporadyczne błędy mogą powodować problemy, które nie pojawiają się przez długi czas. Możesz być pewien, że Murphy cię dopadnie, jeśli wiesz o błędzie pamięci i zignoruj ​​go.

BroScience
źródło
4
Pominąłeś część, w której sugeruje się wąską definicję „ważnego”: „Często jesteśmy pytani o wiarygodność błędów zgłaszanych przez Mestest86. W zdecydowanej większości przypadków błędy zgłaszane przez test są prawidłowe. Istnieją pewne systemy, które powodują Memtest86 zostanie pomylony co do wielkości pamięci i spróbuje przetestować pamięć nieistniejącą. Spowoduje to zgłoszenie dużej liczby kolejnych adresów jako złych i na ogół będzie wiele błędów.
horatio
3
Ma na myśli poprawność, ponieważ „błędy przerywane są prawdziwymi błędami, a nie artefaktem Memtest”. Ale to niekoniecznie przekłada się na wadliwą pamięć RAM. Występują przerywane błędy pamięci RAM, dlatego istnieje coś takiego jak korekcja błędów pamięci RAM . Google zmierzyło to na swoich serwerach: „przeciętny moduł DIMM napotyka prawie 4000 błędów, które można naprawić rocznie” . Zobacz także ZDNet
jg-faustus,
28

Wygląda na to, że tylko jeden bit jest uszkodzony pod tym adresem (tzn. Nie jest ustawiony na logikę 1, gdy jest oczekiwany). Jeśli można odtworzyć błąd, pamięć RAM jest uszkodzona. Nawet powtarzalny 1-bitowy błąd jest nadal błędem i może powodować problemy podczas korzystania z komputera.

Prawidłowo działająca pamięć nie powinna * nigdy ** zawierać żadnych błędów, zgodnie z oczekiwaniami komputera (i dlatego powodują awarię, gdy masz złą pamięć, jako zabezpieczenie; nie można niezawodnie uruchomić komputera z wadliwą pamięcią, ponieważ komputer może być uszkodzony instrukcje lub dostarczyć / przechowywać uszkodzone dane ).


* w wystarczająco długim czasie bity DRAM mogą ulec uszkodzeniu ze źródeł zewnętrznych, takich jak promieniowanie tła; zdarzenie jest zwykle tak rzadkie, że większość komputerów uruchamia Memtest przez tygodnie bez błędów. Zobacz także pytanie Przepełnienie stosu: „ Kosmiczne promienie: jakie jest prawdopodobieństwo, że wpłyną one na program? ”.

Przełom
źródło
Do tej pory nie ma więcej błędów. Test jest nadal uruchomiony. W tym momencie może tylko hipotetyczne jest pytanie „co, jeśli jest to jedyny pojedynczy błąd, który pojawia się po uruchomieniu testu przez tydzień?”
DustByte,
6
@DustByte wtedy zakładam, że jest w porządku. Niepokojące byłoby tylko, gdyby ten sam błąd wystąpił w tym samym miejscu pamięci, co wskazywałoby na wadliwą komórkę DRAM. Wiele rzeczy może zmienić wskaźnik błędów pamięci RAM, w tym promieniowanie tła (np. Burze z promieni kosmicznych lub inne źródła promieniowania).
Przełom
5
w jednym przypadku Fermilab mierzył 2,5 „problemów z pojedynczym zdarzeniem” dziennie na wielu maszynach z połączonymi 160 Gbitami. Przypisali to promieniowaniu tła. Wysokość ma znaczenie w tym przypadku: Boulder Colorado zobaczy to częściej niż w Dolinie Śmierci
horatio
Że przepełnienie stosu pytanie było naprawdę wnikliwe - Nie wiedziałem, że stopy błędu z powodu promieniowania kosmicznego było dość , że wysokie.
Shinrai