Ubuntu 12.04 zamarł, wymagając zasilania. Czego powinienem szukać / grep w logach?

8

To nie pierwszy raz, kiedy Ubuntu zamarł. Ostatni raz, sprawdziłem „niedawno zaktualizowane pliki” w /var/log/i /var/crash/a przyczyną tego problemu wydaje się być „LibreOffice”.

To się powtórzyło.

Nic nie działa, z wyjątkiem przycisku wyłączania (na podstawie wcześniejszych doświadczeń). Nie mogę nawet otworzyć TtyCtrl+Alt+F{1..6}

Mam dużo pamięci (7,7 GB), pamięci RAM (2 x 3,16 GHz) i miejsca na dysku twardym (100 GB na dysku SSD 256 GB).

Nie mogę nic zrobić poza zamknięciem się. Komputer przeszedł memtest.

Czego powinienem szukać (grep) w logach?

Aktualizacja: przesłałem błąd tutaj: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/1023916/

Abe
źródło
Dokładny duplikat tutaj: askubuntu.com/questions/4408/...
Tom Brossman,
1
@TomBrossman podobne pytanie, z tym wyjątkiem, że wszystkie odpowiedzi zakładają pewną odpowiedź. [Najbliższa odpowiedź] (musisz po prostu ponownie uruchomić maszynę. Niech nigdy nie dojdziesz do tego punktu.) Bardzo krótko dotyka tej sprawy na końcu „będziesz musiał po prostu ponownie uruchomić maszynę. nigdy nie osiągnij tego punktu ”. To nie pomaga mi zapobiec kolejnemu wystąpieniu.
Abe
1
@TomBrossman Zaktualizowałem pytanie, aby było bardziej szczegółowe
Abe,

Odpowiedzi:

2

Zamrożenie brzmi podobnie jak błąd w Xorg lub w jądrze. Próbowałeś ssh do skrzynki? Czasami działa to, nawet jeśli lokalne interfejsy użytkownika nie odpowiadają. Działające połączenie ssh może być bardzo pomocne przy debugowaniu tego rodzaju problemu.

Z danych, które podałeś, wybrałbym dziennik jądra. Wydaje się, że libreoffice z jakiegoś powodu rozbił się, aw ciągu sekundy chrom też zniknął. W tym czasie zdecydowanie był jakiś problem. Przyjrzyj się bliżej dziennikowi wokół tych linii błędów i sprawdź, czy możesz zidentyfikować pierwszy komunikat o błędzie tej kaskady zdarzeń. Znaczniki czasu po lewej stronie powinny być przydatne, ponieważ każde zdarzenie związane z zamrożeniem powinno być bardzo zbliżone do dwóch, o których wspomniałem.

Sądząc po dwóch zdarzeniach zawartych w twoim dzienniku, wydaje się prawdopodobne, że awaria libreoffice w jakiś sposób spowodowała niestabilność X, powodując zarówno zawieszenie interfejsu użytkownika, jak i awarię chrome. Zauważysz, że chrom rozbił się w bibliotece X.

MvG
źródło
1
Naprawdę mogę ssh do pudełka. Co następne?
Abe
Spójrz na /var/log/Xorg.0.log. Wykonaj, dmesgaby zobaczyć najnowsze dane wyjściowe jądra. Być może uruchom pstreei / lub ps -Asprawdź, które procesy nadal istnieją. Następnie możesz albo zebrać więcej informacji, albo sprawdzić, czy możesz zrestartować serwer X. Ten ostatni jest sudo restart lightdmbezczynny, ale mogę się mylić.
MvG
W porządku. Po znalezieniu kilku bitów na forach ubuntu dotyczących komunikatu „Xorg Tainted P” w środku /var/log/kern.log, zdałem sobie sprawę, że nie zainstalowałem ponownie zastrzeżonego sterownika ATI po aktualizacji do 12.04, i że to może być problem. Więc ponownie zainstalowałem sterownik ATI. Nawiasem mówiąc, /var/log/Xorg.0.logod dzisiaj było> 1000 linii, więc nie wiedziałem nawet, od czego zacząć. Dzięki za pomoc. Dam ci znać, co znajdę.
Abe
Nie, zainstalowanie zastrzeżonego sterownika nie naprawiło tego.
Abe
1
W porządku. Zrestartowałem już; ale kiedy zdarzy się to następnym razem (uwaga do siebie :) tutaj są instrukcje dotyczące zgłaszania błędu „GPU lockup
Abe
0

Pracowałem w domyślnym trybie „waniliowym”, chociaż mam zainstalowane xfce i kde.

Według mnie instalacja waniliowa oznacza czystą instalację dystrybucji. Wypróbuj czystą instalację (jak w formacie wszystko , utwórz nowego użytkownika i spróbuj ponownie). Oczywiście przed zrobieniem tego wykonaj kopię zapasową ważnych plików.

Ponadto zamiast ponownej instalacji możesz spróbować utworzyć nowego użytkownika . Może to wskazać problem: jeśli nowy użytkownik działa, problem znajduje się w ustawieniach użytkownika domowego. Jeśli nie, oznacza to problem systemowy (a ponowna instalacja prawdopodobnie go rozwiązałaby)

Nie instaluj niczego innego. Nie używaj PPA. Aktualizuj oprogramowanie tylko za pomocą menedżera aktualizacji lub apt-get, bez zmiany / dodania pliku sources.list. Oznacza to instalację waniliową. Zobacz, jak system reaguje przez 3-4 dni. Następnie zacznij dodawać oprogramowanie jeden po drugim, aby odkryć problematyczny pakiet.

Po ponownym uruchomieniu system zwykle dołącza „.old” lub „.0” w nazwie pliku.

Powiedziałbym, że te pliki dziennika byłyby pouczające:

tar czf mylogs.tar.gz --ignore-failed-read ~/.xsession-errors.old /var/log/Xorg.0.log.old /var/log/dmesg.0 /var/log/syslog.1 /var/log/kern.log.1 /var/log/apport.log.1 /var/log/pm-powersave.log.1
file-roller mylogs.tar.gz

... lub jeśli wolisz osobno:

cat ~/.xsession-errors.old
cat /var/log/Xorg.0.log.old
cat /var/log/dmesg.0
cat /var/log/syslog.1
cat /var/log/kern.log.1
cat /var/log/apport.log.1
cat /var/log/pm-powersave.log.1
Savvas Radevic
źródło
Miałem na myśli „tryb waniliowy”, jak przy wyborze „ubuntu” zamiast „gnome classic”, „ubuntu 2D”, „xubuntu” itp. Przy logowaniu - w przeciwieństwie do „instalacji waniliowej”. Nie jestem pewien, jak inaczej to nazwać. Ale przed ponowną instalacją spróbuję dalej debugować.
Abe
Czy pomocne byłoby opublikowanie wszystkich tych dzienników? Jeśli tak, jak mogę usunąć jakiekolwiek prywatne dane?
Abe
Nie wiem, czy to pomogłoby komukolwiek, a na pewno nie mnie. Może ktoś chętnie zajrzy do dzienników. Nie wiem, jak usunąć prywatne dane z dzienników, możesz je przeglądać i sam decydować na podstawie poziomu prywatności i obaw. Dlaczego nie spróbujesz utworzyć nowego użytkownika ? Jeśli nowy użytkownik działa, problem znajduje się w ustawieniach użytkownika domowego. Jeśli nie, jest to problem systemowy (a ponowna instalacja prawdopodobnie go rozwiązałaby)
Savvas Radevic
0

Różne aplikacje segfault i ups jądra zwykle są objawami problemów sprzętowych. Spróbuj najpierw uruchomić memtest, prawdopodobnie zakończy się niepowodzeniem z błędami.

Giovanni Toraldo
źródło
Przeprowadziłem już memtest i zdałem, ale jest to oczywiście pomocne podejście do próby. Zmodyfikowałem swoje pytanie, aby dodać tę informację.
Abe