Śledzenie losowego BSOD w Windows 7

8

Dostałem komputer z systemem Windows 7, który losowo, kilka razy dziennie, boduje z PAGE_FAULT_IN_NONPAGED_AREA (50) lub WHEA_UNCORRECTABLE_ERROR (124). Awarie występują niezależnie od obciążenia. Brakuje mi pomysłów, jak to wyśledzić.

  1. Analiza minidumps pokazuje awarię w pliku ntkrnlmp.exe / WMIADAP.exe
  2. System ma dużą moc (600 w)
  3. Ram sprawdza się dobrze za pomocą memtest86 + przez weekend.
  4. System jest czysty w środku. Nie gromadzi się kurz. Temperatury pozostają niskie.
  5. O ile mi wiadomo (i historia niezawodności pokazuje) żadne nowe sterowniki nie były instalowane przez kilka miesięcy przed wystąpieniem problemów. Wszystkie sterowniki są teraz aktualne.
  6. sfc / scannow zgłasza system jako czysty.
  7. CHKDSK zgłasza dyski jako czyste
  8. Usunięcie AV (Avast) nie ma żadnego efektu.

Czy są jeszcze jakieś rzeczy, które należy wypróbować w systemie Windows 7, zanim zacznę wymieniać sprzęt?

Edycja: system jest zbudowany na zamówienie, ale nie jest przetaktowany. Główne części to:

  • MB: MSI P6N Diamond
  • Procesor: Core 2 Duo E6850
  • GPU: Raedon 5850
  • Zasilacz: Corsair HX620
  • Pamięć: Corsair TWIN2X4096-6400C5
  • HD: Intel SSD X25-M G2

Edycja: Awarie występują w grupach i wygląda na to, że ustąpiły teraz na page_fault. Oto ostatnia wiązka, w tym sterownik, który je spowodował:

10-04-22 16:01  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-22 09:03  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-22 02:27  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-21 22:29  PAGE_FAULT_IN_NONPAGED_AREA Ntfs.sys    Ntfs.sys+b3293
10-04-21 17:32  PAGE_FAULT_IN_NONPAGED_AREA rdpbus.sys  rdpbus.sys+1f0a790
10-04-21 16:02  PAGE_FAULT_IN_NONPAGED_AREA serenum.sys serenum.sys+29fae00
10-04-21 15:00  PAGE_FAULT_IN_NONPAGED_AREA rdprefmp.sys    rdprefmp.sys+3ae8790
10-04-21 12:59  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2b12790
10-04-21 11:22  PAGE_FAULT_IN_NONPAGED_AREA rdpencdd.sys    rdpencdd.sys+289f70
10-04-21 10:43  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+5b68760
10-04-21 10:34  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+5aea720
10-04-21 10:18  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-21 04:19  PAGE_FAULT_IN_NONPAGED_AREA rassstp.sys rassstp.sys+1e72760
10-04-21 04:11  PAGE_FAULT_IN_NONPAGED_AREA Msfs.SYS    Msfs.SYS+4ce9330
10-04-21 03:16  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2a5ae00
10-04-21 03:03  PAGE_FAULT_IN_NONPAGED_AREA raspptp.sys raspptp.sys+2150420
10-04-21 02:12  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-21 02:03  PAGE_FAULT_IN_NONPAGED_AREA TDI.SYS TDI.SYS+163cb90
10-04-21 00:45  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-21 00:13  PAGE_FAULT_IN_NONPAGED_AREA VClone.sys  VClone.sys+2138330
10-04-20 23:20  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+6033
10-04-20 21:01  PAGE_FAULT_IN_NONPAGED_AREA raspppoe.sys    raspppoe.sys+399d250
10-04-20 20:47  PAGE_FAULT_IN_NONPAGED_AREA umbus.sys   umbus.sys+2921760
10-04-20 15:09  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+6c97760
10-04-20 15:03  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+4245760
10-04-20 14:57  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+16a2f70
10-04-20 13:10  PAGE_FAULT_IN_NONPAGED_AREA rasl2tp.sys rasl2tp.sys+ff46f180
10-04-20 11:47  PAGE_FAULT_IN_NONPAGED_AREA raspppoe.sys    raspppoe.sys+21ff790
10-04-20 10:26  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 09:57  PAGE_FAULT_IN_NONPAGED_AREA fltmgr.sys  fltmgr.sys+16df
10-04-20 09:27  PAGE_FAULT_IN_NONPAGED_AREA raspptp.sys raspptp.sys+1fae790
10-04-20 05:21  PAGE_FAULT_IN_NONPAGED_AREA hal.dll hal.dll+101bc
10-04-20 03:23  PAGE_FAULT_IN_NONPAGED_AREA ks.sys  ks.sys+27d2760
10-04-20 03:17  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 03:04  PAGE_FAULT_IN_NONPAGED_AREA csc.sys csc.sys+390f480
10-04-20 01:12  PAGE_FAULT_IN_NONPAGED_AREA peauth.sys  peauth.sys+91d760
10-04-20 01:04  PAGE_FAULT_IN_NONPAGED_AREA NDProxy.SYS NDProxy.SYS+28a7760
10-04-20 00:57  PAGE_FAULT_IN_NONPAGED_AREA USBD.SYS    USBD.SYS+240c7c0
10-04-20 00:51  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-20 00:44  PAGE_FAULT_IN_NONPAGED_AREA rassstp.sys rassstp.sys+1567790
10-04-20 00:38  PAGE_FAULT_IN_NONPAGED_AREA usbohci.sys usbohci.sys+1e20760
10-04-20 00:32  PAGE_FAULT_IN_NONPAGED_AREA wfplwf.sys  wfplwf.sys+3cb8760
10-04-20 00:26  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+21e0570
10-04-20 00:10  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+2ef0a10
10-04-20 00:07  PAGE_FAULT_IN_NONPAGED_AREA HIDPARSE.SYS    HIDPARSE.SYS+2600760
10-04-20 00:01  PAGE_FAULT_IN_NONPAGED_AREA ntoskrnl.exe    ntoskrnl.exe+70600
10-04-19 22:47  PAGE_FAULT_IN_NONPAGED_AREA kbdclass.sys    kbdclass.sys+2aba760
10-04-19 22:41  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+baf4010
10-04-19 20:37  PAGE_FAULT_IN_NONPAGED_AREA Ntfs.sys    Ntfs.sys+bb16c
10-04-19 20:21  PAGE_FAULT_IN_NONPAGED_AREA cdrom.sys   cdrom.sys+b12da0

Szybkie statystyki, które powodują awarie sterownika, nie dają mi większej pewności. Jasne, jądro i cdrom pojawiają się na górze, ale reszta wydaje się mniej więcej wszystkim w systemie operacyjnym:

cdrom.sys     9
ntoskrnl.exe  8
fltmgr.sys    4
raspptp.sys   4
Msfs.SYS      3
Ntfs.sys      2
raspppoe.sys  2
csc.sys       1
hal.dll       1
HIDPARSE.SYS  1
kbdclass.sys  1
ks.sys        1
NDProxy.SYS   1
peauth.sys    1
rasl2tp.sys   1
rdpbus.sys    1
rdpencdd.sys  1
rdprefmp.sys  1
serenum.sys   1
TDI.SYS       1
umbus.sys     1
USBD.SYS      1
usbohci.sys   1
VClone.sys    1
wfplwf.sys    1
pehrs
źródło
Czy wiesz, czy komputer, który uzyskałeś, był maszyną zbudowaną na zamówienie lub od firmy Bigbox, takiej jak HP lub Dell? BSOD błędów strony zwykle dotyczą błędów pamięci, a BSOD WHEA zwykle wskazują procesor. Czy wiesz, czy komputer został przetaktowany?
ryanyama
To niestandardowa kompilacja, ale dość standardowy sprzęt. Zegar jest standardem.
pehrs
5
Podczas wyszukiwania w Google, LOLed na to img361.imageshack.us/img361/9923/hidden0rp.jpg
Hugh Allen

Odpowiedzi:

6

Mimo że sterownik może być aktualny, zarządzany przez niego sprzęt mógł zostać niestabilny i spowodować jego przerwanie.

Możesz wypróbować BlueScreenView, aby przeanalizować zrzuty:

BlueScreenView skanuje wszystkie pliki minidump utworzone podczas awarii „niebieskiego ekranu śmierci” i wyświetla informacje o wszystkich awariach w jednej tabeli. Dla każdej awarii BlueScreenView wyświetla nazwę pliku minidump, datę / godzinę awarii, podstawowe informacje o awarii wyświetlane na niebieskim ekranie (kod kontroli błędów i 4 parametry) oraz szczegóły sterownika lub modułu, który prawdopodobnie spowodował awarię ( nazwa pliku, nazwa produktu, opis pliku i wersja pliku).
Dla każdej awarii wyświetlanej w górnym okienku możesz wyświetlić szczegóły sterowników urządzeń załadowanych podczas awarii w dolnym okienku .BlueScreenView zaznacza również sterowniki, których adresy znajdują się na stosie awarii, dzięki czemu można łatwo zlokalizować podejrzane sterowniki, które prawdopodobnie spowodowały awarię .

harrymc
źródło
Nie wiedziałem o tym narzędziu. Dzięki! To wydaje się bardzo przydatne. Stworzyłem podsumowanie ostatniej grupy awarii i dodałem je do pytania. Nie jestem pewien, czy to przyniesie więcej jasności w tej sprawie, ponieważ awarie są dobrze rozłożone ...
Pehrs
@pehrs: Chciałbym zacząć wyciągać niepotrzebne urządzenia, aby sprawdzić, czy problem zniknie. Zaczynałbym oczywiście od napędu CD, który prawdopodobnie jest najłatwiejszy do wymiany.
harrymc
Wyciągnąłem wtyczkę z napędu DVD i jak dotąd jest stabilna. Daję mu jeszcze kilka dni, zanim zamknę to pytanie. Nie pamiętam, żeby kiedykolwiek słyszałem o napędzie DVD powodującym BSOD, ale chyba wszystko po raz pierwszy.
pehrs
@pehrs tak, każda rzecz podłączona do komputera może to powodować. Napęd DVD prawdopodobnie pobiera zbyt dużą moc lub jest zły i wysyła zniekształcone dane do kontrolera IDE / SATA, powodując dławienie komputera.
Earlz
3

Moje całkowicie nienaukowe testy sugerują, że pierwszym elementem, który próbuje wymienić, jest karta wideo. (najlepiej z inną marką)

Moje „testowanie” polega na wyszukiwaniu w Google <component>i <component> BSODdzieleniu liczby trafień dla drugiego przez pierwszy, aby uzyskać procent:

  • E6850 1,7%
  • MSI P6N Diament 2,3%
  • Radeon 5850 9,2%
  • Nie sądzę, że to pamięć RAM z powodu memtest86
  • PSU i SSD również wydają się mało prawdopodobne

BTW, kiedy miałem problemy z tunerami telewizyjnymi kilka lat temu, użyłem tej metody, aby wybrać dwa tunery, których obecność / sterowniki prawdopodobnie nie spowodowały żadnych awarii. W połączeniu z moją niechęcią do ponownego uruchamiania w celu aktualizacji często mam przestoje mierzone w tygodniach. (Często mogę znaleźć program, który korzysta z pliku, który wymaga wymiany, zamknij go i zastąp plik ręcznie - nawet jeśli program jest Eksploratorem)

Hugh Allen
źródło
2

Jak długo masz komputer? Czy to może być problem z oprogramowaniem? Przed wymianą sprzętu możesz spróbować ponownie zainstalować ponownie system Windows.

Earlz
źródło
System działał stabilnie przez około 1 rok, zanim to się stało. Warto zainstalować ponownie, ale jeśli przebuduję, prawdopodobnie zastąpię hw w tym samym czasie.
pehrs