Szukam wskazówek, wskazówek i odpowiedzi, jak rozpocząć rozwiązywanie problemów, gdy:
- Problem jest sporadyczny
- Problem może leżeć dosłownie wszędzie - system operacyjny; darmowe oprogramowanie źródłowe; moje własne oprogramowanie; zakupione oprogramowanie; okruchy na klawiaturze; konkretna kombinacja oprogramowania, z którego obecnie korzystam; Demon Maxwella; mali niebiescy mężczyźni faktycznie obsługujący maszynę rozpoczęli strajk; itp.
- Mam wiedzę specjalistyczną tylko w kilku obszarach, które są potencjalnymi kandydatami na przyczynę problemu.
Konkretny problem, który mam, jest wyszczególniony poniżej jako przykład, ale nie szukam odpowiedzi na mój obecny problem, ale raczej gdzie i jak zacząć rozwiązywać takie problemy.
Obecnie mam problem z moją nową maszyną. Kilkakrotnie maszyna właśnie się zawiesiła; nie akceptujących naciśnięć klawiszy, kliknięć myszką ani niczego innego poza włącznikiem / wyłącznikiem zasilania. Zawsze niezmiennie przeglądam sieć; Uruchomiłem kilka (<= 6 innych aplikacji). Żadna z tych aplikacji nie jest ważna; i stanowią mieszankę programów komercyjnych i programów typu open source, zazwyczaj migrowanych z różnych wersji Uniksa.
Moja maszyna to czterordzeniowy laptop z systemem Windows 7 I7.
EDYTOWAĆ:
Chociaż stwierdziłam, że opis problemu był tylko przykładem, niektóre komentarze koncentrują się na rozwiązaniu tego problemu. Niestety, ponieważ był to tylko przykład, podane informacje są poprawne, ale niekompletne. Aby uniknąć marnowania czasu przez ludzi na próby zdalnej pomocy przy rzeczywistym problemie, podaję kilka innych informacji na temat mojej konfiguracji. Jak pierwotnie powiedziałem, nie szukam odpowiedzi na ten konkretny problem.
Moja maszyna jest laptopem o dużej mocy; jest moją główną maszyną; służy do programowania i pisania technicznego, komunikacji - e-mail, WWW, FTP itp., a także do edycji i indeksowania zdjęć. Rygorystyczny i obszerny pakiet programów testujących sprzęt, w tym testy procesora, testy pamięci i testy wszystkich innych komponentów, są uruchamiane co najmniej raz w miesiącu. Co najmniej raz w miesiącu uruchamiane jest także pełne skanowanie w poszukiwaniu wirusów; pełne skanowanie w poszukiwaniu programów szpiegujących; czyszczenie dysku; i defragmentacja dysku.
Dysk zawiera około 3 * 10 ^ 6 plików; użycie dysku wynosi 300 Gb, pozostawiając 150 Gb za darmo. Pamięć to 8 Gb. Podczas gdy maszyna może się nieco nagrzać, kiedy korzystam z pełnego zestawu głównych narzędzi programistycznych, problem napotkałem tylko wtedy, gdy korzystam z niej bardzo lekko - przeglądanie stron internetowych oraz Textpad i Graphviz oraz baza danych Firebird i lekka przeglądarka baz danych (Flame Robin ). W tych okolicznościach nawet wentylator nie jest lekko ciepły. Nie wprowadziłem żadnych zmian w oprogramowaniu, systemie operacyjnym ani sprzęcie w okresie, w którym napotkałem problem. Nastąpiło wiele automatycznych aktualizacji - Microsoft, Adobe i Lenovo głównie, ale nie wyłącznie.
To tło umieszcza w kontekście (mam nadzieję) moje powody, dla których zadałem to pytanie w taki sposób, jak ja. Teraz zacznę badać różne dzienniki wymienione w odpowiedziach, jako pierwszy krok w próbie zawężenia pola dochodzenia. Spróbuję wykonać jedną z cech sugerowanych w odpowiedziach, które otrzymałem do tej pory - cierpliwość - w moim dochodzeniu.
Odpowiedzi:
Znajdź lepszy pomysł.
Nie wygrasz bitwy bez wystarczających informacji terenowych.
Opisz szczegółowo swój problem, abyś miał dobry pomysł, kto wie, że zdarzy się to tylko raz.
Śledź w czasie, co wydarzyło się wcześniej i razem z problemem, zarówno ty, jak i komputer.
Pomyśl o możliwych przyczynach, ponieważ czasem może to być coś, co nie jest oczywiste.
Uzyskaj więcej informacji, gdy nie masz pojęcia o tym, co się dzieje, może to obejmować zdarzenia , narzędzia SysInternals , analizę wydajności , debugowanie i inne narzędzia w Twojej wiedzy .
Sprawdź swoje założenia, aby upewnić się, że myśli nie odfiltrowują przyczyny.
Dziel i rządź.
Ponieważ w ten sposób wojsko pokonuje swojego przeciwnika, nawet gdy przewaga liczebna jest większa.
Wyeliminuj możliwe przyczyny, w przeciwnym razie będziesz mieć problem ze śledzeniem problemu. W ten sposób będziesz zbliżał się do pierwotnej przyczyny problemu, dzięki czemu możesz łatwiej rozwiązać problem.
Na przykład w przypadku sprzętu odłącz i usuń wszystko, czego nie potrzebujesz do rozwiązania problemu. W ten sposób możesz odłączyć komponent powodujący problem. A potem znów chodzi o włożenie połowy komponentów, sprawdzenie, czy się nie powtórzy, i powtórzenie podziału, aż pojawi się zły komponent ...
Testowanie czegoś na innym komputerze, jeśli jest dostępny, jest również dobrą korzyścią w rozwiązaniu problemu.
Na przykład w przypadku oprogramowania , ponowne uruchomienie w trybie awaryjnym pomaga również wyłączenie wpisów startowych. Dotyczy to również włączania / wyłączania ustawień, próbowania domyślnej konfiguracji i tak dalej ...
Przetestujmy to.
To właściwy opis sam w sobie, nie zdarza się to ani razu .
Wiesz, co się stało z problemem,
ale nie pomyślałeś o tym, co zrobiłeś Ty lub Twój komputer przed problemem .
Nie mogę tego powiedzieć, ale ty, twój dziennik zdarzeń i ostatnio zmodyfikowane pliki / foldery mogą powiedzieć.
Prawdopodobna przyczyna jest najprawdopodobniej związana z procesorem , ponieważ jest to składnik, który przetwarza rzeczy.
Bardziej konkretnie może to być proces, sterownik lub niesprawny sprzęt (być może problemy z temperaturą?).
Wiem, że to procesor, ale nie wiem co. Wydarzenia tego nie pokazują, Process Explorer zawiesiłby się na DPC .
Tak więc, w następnym kroku, pozwalam na uruchomienie analizy śladu, którą zamykam po wystąpieniu zawieszenia.
Patrzę na ślad i widzę, że przyczyną problemu jest sterownik X !
Nie poczyniono żadnych rzeczywistych założeń. Założeniem procesora jest nasze podejście Divide & Conquer ...
Więc tutaj zaczynam się dzielić, aby pokonać problem, przestaję raz rozwiązany:
Masz problem z aktualną wersją sterownika?
Zaktualizuj sterownik do najnowszej wersji.
Masz problem z najnowszymi wersjami sterownika?
Zdobądź nowy ślad. Zaktualizuj sterownik do starszej wersji innej niż początkowa.
Masz problem z urządzeniem? Problem z konfiguracją w rejestrze?
Zdobądź nowy ślad. Zainstaluj ponownie i / lub wyłącz urządzenie, jeśli to możliwe.
Problem jest przypadkowy, czy procesor się nagrzewa?
Sprawdź temperaturę procesora, w razie potrzeby wymień wentylator.
Problemem nie jest procesor, czy istnieją inne wpływy na sprzęt i oprogramowanie?
Usuń sprzęt i wyłącz oprogramowanie, aby uruchomić wpływ innych firm.
Problem nie dotyczy części wymiennej, należy go wymienić.
W najgorszym przypadku, jeśli wszystko inne zawiedzie, musisz udać się na wymianę.
Zdobywanie nowych śladów i usuwanie sprzętu daje nam więcej informacji, dzięki czemu wiemy, gdzie szukać dalej.
źródło
Dobre logi i intuicja - naprawdę.
źródło
C:\Windows\*.log
,C:\Windows\Logs
,C:\Windows\inf\*.log
a takżePerformance Monitor > Data Collector Sets > (Startup) Event Trace Sessions
. Ponadto, @JRobert, +1 za wyjaśnienie, jak uzyskać bardziej szczegółowy pomysł ...Zwykle zaczynam od dzienników zdarzeń i wszelkich dzienników, które program może samodzielnie utworzyć. Programy czasami tworzą dziennik w folderze programu.
Po określeniu godziny przeszukaj dzienniki w poszukiwaniu zdarzeń. Oczywiście dzienniki systemu Windows mogą zawierać błędy zatrzymania, które można łatwo zidentyfikować.
Sprawdź wszystkie sterowniki i upewnij się, że są aktualne.
Cierpliwość będzie również wymagana w dużych dawkach.
źródło
Oprócz wszystkich dobrych porad, które już podano, jeśli pliki dziennika nie dają wiele do zrobienia, często warto przeprowadzić odpowiedni test pamięci maszyny - wadliwa pamięć może powodować różnego rodzaju dziwne przerywane zawieszanie się i awarie. Wbudowany test pamięci jest znacznie bardziej zbliżony do liczby pamięci, ponieważ niezwykle rzadko test włącza się, by wykryć błąd pamięci.
Google for Windows Memory Diagnostic i nagraj go na dysku CD. Jest stary, ale jest jednym z lepszych testów pamięci i jest bezpłatny.
źródło