Ile wejściówek wystarczy w Memtest?

52

Mój komputer zawiesza się dzisiaj losowo przy różnych okazjach i w różnych systemach operacyjnych, co wymaga naciśnięcia przycisku resetowania. Podejrzewam, że może to być problem z pamięcią i zrobiłem memtestz memtest86 .

Przeszedł dwa przejścia bez błędów. Czy to wystarczy, czy muszę pobiegać przez noc, dopóki nie zobaczę błędu?

Co jeśli problem dotyczy płyty głównej lub procesora? Skąd mam wiedzieć bez nowej płyty głównej?

Specyfikacja systemu:

  • Pamięć: 2,0 GB
  • Dwurdzeniowy procesor Pentium® E5300 @ 2,60 GHz x 2
  • Płyta główna: ASUS P5KPL-AM EPU
Przepełnienie pytania
źródło
Prawdopodobnie już to zrozumiałeś, ale następnym razem spójrz na dziennik jądra w Linuksie po jego zawieszeniu. To da ci wyobrażenie o tym, co się dzieje.
scottkosty
@CarComp: Proszę opublikować wyniki nieudanego memtestu.
harrymc

Odpowiedzi:

25

Testy nie mogą udowodnić braku błędów, a jedynie ich obecność

Memtest doskonale nadaje się do wyszukiwania błędów w pamięci RAM. Częstotliwość znajdowania błędów jest z konieczności odwrotnie proporcjonalna do stopnia uszkodzenia pamięci RAM. Im bardziej zepsuty, tym szybciej znajdzie błędy.

W 90% przypadków, jeśli RAM ma problem, memtest wykryje go w ciągu 10 sekund, 99% czasu, wystarczy jedno przejście, aby znaleźć problem. Im dłużej trzeba znaleźć problem, tym bardziej jest on subtelny i tym mniej prawdopodobne jest, że jest to przyczyną problemu z komputerem (ale powinieneś dostać nowy RAM, jeśli pojawi się choć jeden błąd)

Ponieważ komputer zawiesza się dość często i wykonałeś kilka przebiegów, prawdopodobnie nie jest to twoja pamięć RAM. Kolejnym krokiem jest przetestowanie dysku twardego, a następnie procesora za pomocą narzędzia takiego jak Ultimate Boot CD lub Hiren's. (Większość współczesnych BIOS-ów ma również wbudowaną funkcję testowania dysku twardego)

David
źródło
2
Sugeruję, aby spróbować wyczyścić pamięci RAM i gniazdo i przetestować je ponownie w pierwszej kolejności (użyj alkoholu izopropylowego; uzyskał pozytywne doświadczenia ze sprayem dezynfekcyjnym jako zamiennikiem; Ale nie rozpylaj tego ostatniego bezpośrednio na pamięć RAM - tylko na szmatkę, ponieważ ma ona służyć tylko jako środek rozdzielający i ostatecznie pozostawi pewne pozostałości, gdy zostanie użyty w zbyt dużych ilościach)
SDwarfs
3
Więc jeśli ktoś popełni co najmniej jeden błąd - wyrzuci swoją pamięć RAM, kupi nowy? Jesteś pewny?
Tarasovych
1
@Tarasovych: To zależy od tego, jak ważna jest dla ciebie stabilność systemu. Na komputerach, które utrzymuję w pracy, zrobiłbym dokładnie to (wyrzuć całą pamięć RAM i kup nową), ponieważ (1) pamięć RAM jest tania, a (2) czas na opracowanie oprogramowania jest kosztowny. W rzeczywistości nawet wyrzucenie całego komputera i zakup nowego może okazać się tańsze niż utrata wydajności / pracy z powodu niewiarygodnych komputerów.
Heinzi
@Heinzi rzuć okiem na cenę pamięci RAM dzisiaj i rok temu ... Ale może w twojej lokalizacji jest tania pamięć RAM. Ale zgadzam się, że dobre błędy bez pamięci RAM są niezbędne do rozwoju. Nikt nie lubi błędów RAM / BSOD podczas kodowania)
Tarasovych,
1
Podkręcanie może również powodować te błędy, ale to nie znaczy, że powinieneś wyrzucić RAM, po prostu zmniejszyć podkręcanie lub zwiększyć napięcie dram w bezpiecznym zakresie.
M.kazem Akhgary
21

Uruchomiłem memtest i widziałem 6 przebiegów bez błędów, a następnie ponad 4 błędy na przebieg. Zwykle wykonuję 3-4 podania, ale z pewnością można przeoczyć błędy, wykonując tylko kilka podań. Wyobrażam sobie, że niektóre błędy pojawiają się tylko, gdy moduły pamięci się nagrzewają, co powoduje problemy z pamięcią pracującą pod wysokim napięciem.

Jeff
źródło
jeśli jest to problem związany z ciepłem, czy prime95 nie byłby lepszym wektorem testowym, generującym znacznie więcej ciepła w systemie?
Jeff Atwood,
@JeffAtwood Nie ma tutaj eksperta, ale prime95 niekoniecznie musi wskazywać na błędy pamięci RAM, prawda?
Hele,
Aby przetestować pod kątem błędów związanych z ciepłem, uruchom jedno wystąpienie memtest na rdzeń procesora. Wybierz profil wydajności w obszarze zarządzania energią. W przypadku laptopów nie umieszczaj ich na stojakach chłodzących. Niech memtest działa przez 24 godziny. Jeśli nie ma błędów, nie masz problemów z ram.
user986363
12

W pracy zwykle zostawialiśmy maszyny działające w nocy, ale szczerze mówiąc, za każdym razem, gdy byłem w stanie pokazać problem z pamięcią podczas memtestu, było to w ciągu kilku sekund od uruchomienia.

Nigdy nie widziałem, żeby maszyna wykonała 1 pełny przebieg, aby zawieść na jednym z poniższych. (Nie to, że koniecznie jest to niemożliwe, aby pokazać, że jest rzadkie).

Pracowałem w sklepie komputerowym, w którym mniej więcej codziennie pracowaliśmy na nowych komputerach.

Bez wystarczającej ilości informacji do powiedzenia, więc nadal sądzę, że twój problem jest bardziej przegrzany lub zły.

Ponieważ wypróbowałeś więcej niż jeden system operacyjny, część sterownika wydaje się mało prawdopodobna. Chyba że na przykład wypróbowałeś tylko różne wersje systemu Windows, które używają tego samego sterownika.

azzid
źródło
3
Naprawdę widziałem błędy zaczynające się od przejścia 3. Zakładam, że ma to związek z rozgrzaniem pamięci RAM, procesora i / lub kontrolera pamięci. Wszystkie moje problemy tego rodzaju dotyczyły albo niewłaściwego podłączenia pamięci RAM do gniazda, gniazda do płyty głównej lub zanieczyszczeń na pamięci RAM (gdy wyciągnąłem pamięć RAM, wyczyściłem pamięć RAM + złącze Socket i ponownie włączyłem pamięć RAM, co ostatecznie rozwiązało problem problem).
SDwarfs,
PS: Sugeruję co najmniej 3 podania. Podczas gdy noc z ~ 5-8 karnetów jest bardziej niezawodna.
SDwarfs,
1
Widziałem błędy pojawiające się przy trzecim przejściu, jak sądzę, z powodu ciepła.
benallansmith
1
Widziałem problem pokazany po 2-3 godzinach memtest86 +. Ta sama pamięć przez 30 minut była „ok”.
i486,
12

http://hcidesign.com/memtest/manual.html

100% pokrycia oznacza jedno pełne przejście testu pamięci. Zasadniczo lepiej jest uruchomić wiele przejść. Oto trzy typowe długości testów, których możesz użyć:

  1. Testuj do 100% zasięgu (szybki test, aby upewnić się, że pamięć RAM działa prawidłowo)
  2. Testuj przez 1 godzinę (spowoduje to złapanie wszystkiego oprócz przerywanych błędów)
  3. Testuj przez noc (zalecane; komputer i tak nie robi nic innego w nocy, dlaczego nie masz absolutnej pewności, że pamięć RAM jest dobra?)
Yaccz
źródło
7

Widziałem, że pamięć RAM przechodzi pierwsze 6 przebiegów memtest, a następnie nie udaje się kolejne przejścia, a po uruchomieniu systemu operacyjnego Linux z tą pamięcią RAM blokuje się po 6-8 godzinach. Inne pamięci RAM na tej samej płycie głównej działały dobrze, więc najwyraźniej awaria pamięci RAM była wrażliwa na temperaturę.

Kiedy podejrzewam problem z pamięcią RAM (np. Komputery Dell z lampkami diagnostycznymi), uruchamiam memtest na jednym module RAM na raz w pierwszym gnieździe przez 8-16 godzin. Jeśli przejdzie, to potwierdza, że ​​zarówno gniazdo, jak i moduł pamięci RAM są dobre i mogę (bardziej) pewnie użyć tego gniazda do przetestowania innych modułów pamięci RAM.

użytkownik254993
źródło
Czy na pewno Memtest86 testuje gniazda pamięci RAM? Nie wiedziałem, że tak.
Hashim
6

Moje doświadczenie z memtest86 + różni się nieco od większości ludzi tutaj. memtest86 bardzo mi pomógł przez lata, ale niestety czasami nie wykrywa błędów.

Chociaż memtest działa przez większość czasu, zawiodło mnie to kilka razy. Za pierwszym razem, gdy nie udało mi się wykryć błędów, miałem komputer z 1x 4 GB pamięci DDR3, który dawał mi BSOD związane z pamięcią. Przez cały dzień prowadziłem memtest, mówimy o 15+ karnetach, ale żadnych błędów. Następnie przetestowałem go na zupełnie innym komputerze, to samo, bez błędów. System operacyjny był całkowicie niestabilny, ale w memtest nie wystąpiły błędy. Następnie użyłem innego oprogramowania o nazwie „PC-Check” od Eurosoft, które jest bardzo podobne do memtest, ale wykorzystuje inne algorytmy. Jest także bootowalny, nie wymaga żadnego systemu operacyjnego. Wykrył błędy w mniej niż 5 minut. Następnie mogłem wysłać moduł do Corsair RMA i uzyskać zamiennik.

Tak więc memtest jest bardzo dobry, ale nie zawsze wystarczający. Obecnie używam memtest i PC-check do sprawdzania pamięci. Jeśli memtest nie wykryje błędów, z pewnością sprawdzi się PC i na odwrót. I zaufaj mi, zdarza się to częściej niż mogłoby się wydawać.


źródło
4

MemTest86 próbuje wykonać pełny test pamięci RAM. W ten sposób stał się również dobrym wszechstronnym testem, ponieważ niektóre testy dotyczą również kontrolera pamięci płyty głównej i procesora.

Pamięć RAM znacznie wzrosła, do tego stopnia, że ​​przenośny telefon może dziś zawierać więcej pamięci RAM niż w przypadku komputerów mainframe sprzed 20 lat. Testy uległy zwielokrotnieniu wraz z ewolucją MemTest86, podobnie jak pamięć RAM. Chociaż pamięć RAM stała się szybsza, testy są nadal czasochłonne, mierzone w godzinach, a nawet dniach.

Teraz zła wiadomość : znalazłem co najmniej dwa szanowane źródła, Dziesięć Forów i wiki Jak to daje tę samą radę. Cytuję z Dziesięciu Forów:

MemTest86 + musi działać przez co najmniej 8 przebiegów, aby być blisko rozstrzygającego , nic mniej nie da pełnej analizy pamięci RAM.

Jeśli zostaniesz poproszony o uruchomienie MemTest86 + przez członka Dziesięciu Forów, upewnij się, że wykonałeś pełne 8 karnetów, aby uzyskać rozstrzygające wyniki. Jeśli wykonasz mniej niż 8 przebiegów, zostaniesz poproszony o ponowne uruchomienie.

Powinienem zauważyć, że MemTest86 ma dwie wersje, Free i Pro, gdzie wersja Pro ma kilka dodatkowych testów niż wersja Free i opcje konfiguracji. Różnice możesz zobaczyć w artykule Porównanie funkcji .

Więcej informacji na temat optymalnej liczby przebiegów można znaleźć w artykule Informacje techniczne MemTest86 z opisu pliku konfiguracyjnego MemTest86 mt86.cfg, dostępnego tylko w wersji Pro:

PASS1FULL

Określa, czy w pierwszym przejściu należy przeprowadzić test pełny czy skrócony. Domyślnie w pierwszym przejściu należy przeprowadzić test zredukowany (tj. Mniej iteracji) w celu jak najszybszego wykrycia najbardziej oczywistych błędów.

Wniosek 1 : Pierwsze przejście jest krótsze i szybsze, przeznaczone głównie do wykrywania ciężkich błędów. Fakt, że pierwsze przejście minęło bezbłędnie, jest zachęcające, ale użytkownicy wersji darmowej muszą poczekać na drugie przejście na pełną gamę testów.

Największa liczba podań, jakie znalazłam, była w tym teście:

Test 7 [Moving inversions, 32 bit pattern]

Jest to odmiana algorytmu ruchomych inwersji, który przesuwa wzór danych w lewo o jeden bit dla każdego kolejnego adresu. Początkowa pozycja bitu jest przesuwana w lewo dla każdego przejścia. Aby wykorzystać wszystkie możliwe wzorce danych, wymagane są 32 przebiegi . Ten test jest dość skuteczny w wykrywaniu błędów wrażliwych na dane, ale czas wykonania jest długi.

Wniosek 2 : Test 7 wymaga 32 przejść, aby być całkowicie ukończonym, co biorę za górną granicę liczby przejść wymaganych do naprawdę wyczerpującego testu.

Zaznaczam również, że wiele testów używa losowego wzorca, z innym wzorem dla każdego przejścia, co oznacza, że ​​każde przejście jest inne. Przechodząc do absurdalnych wysokości, możemy dojść do wniosku, że nie ma górnej granicy liczby przejazdów wymaganych dla absolutnie rozstrzygającego wyniku.

Moja opinia

Moim zdaniem, jeśli chodzi o liczbę przebiegów, to należy przejechać tyle przebiegów, ile ma się czasu na oczekiwanie. Dolna granica wydaje się mieć dwa przejścia, ponieważ tylko drugi będzie pełnym sprawdzianem. Ale pytanie „ile wystarczy” nie ma prawdziwej odpowiedzi. Ponownie zauważam, że w dwóch cytowanych powyżej odniesieniach technicznych minimalna liczba przejść wymagana dla dobrego i rozstrzygającego wyniku wynosi 8 przebiegów (być może dlatego, że Test 7 wykona jeden cały 8-bitowy bajt, między innymi).

Z drugiej strony błędy wykryte przez MemTest86 należy traktować bardzo poważnie. Ponieważ postawiono tutaj pytanie o dopuszczalną liczbę awarii, moja odpowiedź brzmi: nawet jedna awaria jest zbyt duża i nie do przyjęcia.

harrymc
źródło
Twoja odpowiedź zawiera spostrzeżenia, które wykraczają poza inne.
CarComp
1

Robię jedno przejście, aby sprawdzić, czy są jakieś oczywiste błędy.

Jeśli wystąpi błąd, nie trzeba więcej przejść.

Jeśli problem z komputerem jest dziwny, na wszelki wypadek zostawiłem go na noc lub w ciągu około 10 godzin.

Robert Niestroj
źródło
1

Zazwyczaj uruchamiam memtest za każdym razem, gdy zmieniam procesor, pamięć lub zauważam dziwne problemy. Powód jest taki - memtest nie tylko testuje pamięć. Wystąpi błąd w trzech innych ważnych przypadkach:

1) Jeśli występują problemy związane z przegrzaniem procesora lub pamięci. Zwykle memtest ładuje procesor dla kilku testów do prawie 100%.

2) jeśli CPU nie może poprawnie uzyskać dostępu do pamięci. Większość testów odczytuje i zapisuje we wszystkich lokalizacjach pamięci.

3) jeśli występują problemy z zasilaniem. Tzn. Słaby zasilacz lub złe kondensatory powodują zbyt wiele skoków kompensujących losowe bity.

Jeśli widzę przynajmniej jeden czerwony błąd, zaczynam szukać tego, co należy usunąć / naprawić przed użyciem sprzętu.

Mikołaj
źródło
1
Chociaż może to być przydatna informacja, nie odpowiada na pierwotne pytanie.
blm
0

Biorąc pod uwagę, że po jednym przejściu wyświetla się Pass complete, no errors, press Esc to exit, zawsze zakładałem, że to wystarczy.

wprowadź opis zdjęcia tutaj

Der Hochstapler
źródło
6
Err, jeśli tak jest naprawdę, czy memtest nie zatrzyma się automatycznie po jednym przejściu, zamiast pozwolić nam kontynuować testowanie na zawsze?
Przepełnienie pytania
@QuestionOverflow: Nie wiem, prawda?
Der Hochstapler