Jakie są najczęstsze przyczyny awarii procesora?

12

Jakie są najczęstsze przyczyny awarii procesora?

Czy istnieją stany pośrednie między doskonale działającym procesorem a martwym?

InquilineKea
źródło
1
Najczęstsze przyczyny to ciepło i nieprawidłowe napięcia. Upewnij się więc, że komputer jest odpowiednio schłodzony i masz dobry zasilacz oraz dobrą ochronę zasilania. Chłodzenie będzie słabe, jeśli twój komputer jest nadmiernie zakurzony.
Zoredache

Odpowiedzi:

9

Może to wymagać tylko awarii jednego tranzystora, zanim procesor przestanie działać - a ponieważ w nowoczesnym procesorze są miliony tranzystorów, możesz zapytać, dlaczego nie zdarza się to częściej.

I w zależności od tego, gdzie tranzystor znajduje się w CPU, efekt może być inny, ale nie sądzę, że możemy spodziewać się stopniowego spadku wydajności: awaria ALU może nie zostać zauważona, dopóki nie zostanie wykonana określona instrukcja, i niektóre instrukcje będą wykonywane rzadziej.

Dlatego CPUS umiera nagle, gdy tranzystor ulegnie awarii. Może to być spowodowane nadmiernie obciążonymi wadami mikroukładu komputerowego, dlatego czynnikiem może być czas.

Nadmierne ciepło może powodować drobne zanieczyszczenia krzemu, które tworzą tranzystory w celu rozproszenia i zmiany parametrów pracy. Ciepło jest nieuniknioną konsekwencją po prostu obsługi tranzystorów, więc brak chłodzenia może ostatecznie spowodować awarie.

Inne przyczyny mogą obejmować awarie połączeń w pakiecie układu CPU, ale producenci zawsze szukają ulepszonych metod pakowania z bardziej niezawodnymi połączeniami i lepszym rozpraszaniem ciepła.

pavium
źródło
2
Upał jest zdecydowanie najczęstszym sposobem. I nigdy nie będziesz wiedział, że to się nie udaje, dopóki nie zaczniesz mieć przypadkowych awarii i błędów. Jedynym sposobem, aby naprawdę powiedzieć, jest debugowanie jądra. Jeśli twoja aplikacja zawiesza się nad prostymi instrukcjami i kopią pamięci, to jest martwa gratka. Albo to, albo podkręcasz zbyt mocno :)
surfasb
Nie nazwałbym przypadkowych awarii i błędów błędami. Jeśli problem zniknie z chłodzenia - świetnie - ale brzmi to tak, jakby sprzęt był eksploatowany poza specyfikacjami projektowymi.
pavium
Chodzi mi o to, że jeśli nie przetaktowuje się w pierwszej kolejności, alternatywą jest awaria procesora. I nie wiem o tobie, ale jeśli mój komputer ulega awarii, gdy procesor zmienia jeden na zero, nazwałbym to awarią. . .
surfasb
Tak, byłem pedantyczny. W powszechnym użyciu komputer ulega awarii, jeśli nie może niezawodnie wykonywać operacji. Powinienem też pamiętać, że kiedy ludzie mówią o procesorze, mogą nie oznaczać układu w dużym kwadratowym pakiecie. Chciałbym , ale to profesjonalna perspektywa.
pavium
Tak, to jest SuperUser. CPU! = CU.
surfasb
3

Szczerze mówiąc, nie ma typowych przyczyn awarii procesora ... przynajmniej w odniesieniu do innych części komputerów. Procesor jest zazwyczaj najbardziej niezawodną częścią komputera. Po prostu tak często nie zawodzą.

Zamiast tego rzeczy, na które należy zwrócić uwagę, aby zawieść, to te z ruchomymi częściami: tradycyjne dyski twarde, napędy optyczne i wentylatory. Niedawno musimy również dodać dyski SSD do tej listy, nawet jeśli nie mają ruchomych części. Kondensatory mają również ograniczoną żywotność, więc można podejrzewać zasilacze i płyty główne, które wykorzystują kondensatory. Czasami masz też słabą pamięć RAM, ale nigdy nie jestem pewien, czy serwatka się psuje.

A teraz, w końcu, dopiero po obejrzeniu większości innych elementów komputera, dochodzimy do procesora. Nawet w przypadku awarii zwykle dzieje się tak, ponieważ wentylator chłodzący (ponownie ruchome części) najpierw się zepsuł, a procesor przegrzał się.

Joel Coehoorn
źródło
1

Wśród innych podanych tutaj przyczyn może również wystąpić zerwane połączenie wewnętrzne. Stosuje się kilka różnych technik wiązania wewnętrznych przewodów „chipowych” z zewnętrznymi przewodami opakowania i wszystkie one mogą ulec awarii.

Tego rodzaju awaria może być prawdopodobnie wynikiem przegrzania, a prawdopodobieństwo awarii wzrasta wraz z „cyklami termicznymi”, nawet przy braku przegrzania. Awaria może początkowo występować sporadycznie (chociaż zwykle powoduje ciężką awarię, gdy się zdarza), ale staje się coraz bardziej trwała, gdy system jest cykliczny.

Tego rodzaju awaria naśladuje awarie widoczne ze złych połączeń pakiet / gniazdo itp.

[Dodano:] I zauważam, że nie wspomniano o „bokobrodach”. Dużym problemem związanym z układami scalonymi i bardzo małymi obwodami drukowanymi są „wąsy” z metalu, które wyrastają z platerowanego okablowania i są zwarte między sąsiednimi „drutami”. Jest to szczególnie problem, gdy wyjmiesz cały ołów (patrz „RoHS”), ponieważ ołów jest zwykle dodawany do stopów drutu, aby zapobiec zatykaniu. Oczywiście problem ten nasila się wraz ze wzrostem temperatury.

Daniel R. Hicks
źródło
1

Z mojego doświadczenia wynika, że ​​ciepło. Jak dlaczego? Za dużo pasty termicznej! Wiele (większość?) Osób wie, że potrzebuje pasty termicznej, ale mogą nie zdawać sobie sprawy, jak mało powinni używać.

Zasadą jest stosowanie wielkości niegotowanego ziarna ryżu, wierzcie lub nie.

Chociaż pasta przewodzi ciepło około 10 razy lepiej niż powietrze, miedź radiatora jest 10 razy lepsza niż pasta, więc chcesz ją jak najbliżej procesora. Pasta jest naprawdę po to, aby wypełnić BARDZO MAŁE pęknięcia, aby nie było w niej powietrza.

statyczny
źródło
0

Interesujący artykuł na temat »Starzenia się tranzystora« ukazał się w czasopiśmie Spectrum IEEE ( http://spectrum.ieee.org/semiconductors/processors/transistor-aging ). Wymienia kilka podstawowych mechanizmów, które mogą prowadzić do awarii pojedynczego tranzystora, co w efekcie może zmniejszyć moc obliczeniową pełnego układu do mocy ziemniaka (lub cegły).

eMPee584
źródło