Serwer SSH ulega awarii losowo raz na tydzień lub mniej więcej i wraca, gdy ktoś loguje się bezpośrednio

0

Mam Lenovo ThinkPad E560 (Ubuntu 16.04.4 LTS)stację w naszym odległym laboratorium z biegiem, do openssh serverktórego można dotrzeć w dowolnym momencie. Od kilku miesięcy serwer ssh losowo ulega awarii raz / dwa razy w tygodniu, wciąż mogę go pingować, ale kiedy próbuję ssh, pojawia się port 22 refused...network unreachablekomunikat „ ”. Jeśli ktoś fizycznie tam wejdzie i po prostu się zaloguje, natychmiast stanie się dostępny przez ssh i dobrze przez kilka dni, a następnie losowo laptop nie będzie dostępny przez ssh i tak dalej. Nawet po odinstalowaniu i ponownej instalacji openssh servernie rozwiązałem problemu.

Co jest tego przyczyną i jak mogę prawidłowo zdiagnozować ten problem, aby go naprawić?

To pytanie wydaje się bardzo znajome, ale nie jest to dokładnie to, o co pyta większość ludzi, co zwykle jest zawieszeniem sesji ssh! Pytam o serwer ssh.

Wielkie dzięki

kwanty
źródło
Po pierwsze, przejrzyj plik /var/log/auth.log. Spójrz na znaczniki czasu, porównując udane logowanie z nieudanymi. Jeśli chcesz zobaczyć wiele komunikatów dziennika z wielu plików, spróbuj uruchomić „grep -rsh sshd / var / log | sort”, a zwróci wszystkie wiersze zawierające „sshd” w folderze / var / log. To może być dużo.
Christopher Hostage
1
Wygląda na to, że maszyna idzie w tryb uśpienia, więc nie można się do niej dostać z sieci; ale gdy ktoś fizycznie podchodzi do maszyny, budzi ją i sieć ponownie staje się dostępna. Nie znam ani Ubuntu, ani Lenovo; czy są ustawienia „mocy”, które można sprawdzić?
hymie
@ hymie to dokładnie tak wygląda, ale dzieje się to od kilku ostatnich miesięcy, przez ostatnie 2 lata było w porządku. Dziwne jest również to, że jeśli spanie miało miejsce, to dlaczego warto poświęcić kilka dni, zwykle komputery idą spać w ciągu kilku minut, maksymalnie przez kilka godzin. Ale dzieje się to raz w tygodniu lub raz na 2 tygodnie.
kwanty
@Christopher Hostage w grep -rsh sshd /var/log |sortogóle nic nie zwraca.
kwanty

Odpowiedzi:

0

Czy możesz zdalnie uzyskać dostęp do innych usług (VNC, serwer HTTP itp.) Na laptopie? Jeśli działają jak serwer SSH, możesz mieć problem z siecią (w tym dziwny)

Spróbuj przeczytać dzienniki SSH przez

mniej /var/log/auth.log | grep ssh

Pamiętaj także o przeczytaniu innych dzienników:

mniej /var/log/auth.log.1 | grep ssh
gzip -c /var/log/auth.log.2.gz | grep ssh | mniej
gzip -c /var/log/auth.log.3.gz | grep ssh | mniej
... 

Spróbuj również na wszelki wypadek:

Uruchom dysk CD na żywo / jakąkolwiek inną dystrybucję Linuksa i uruchom to

fsck -yf / dev / sdx
Zastąp sdx nazwą urządzenia rozruchowego i uruchom ponownie z normalnym. [Odwołanie: https://serverfault.com/questions/801148/ssh-random-crashing#812544 ]

Shadowcoder
źródło
Patrzyłem na /var/log/auth.logmniej więcej w czasie, gdy doszło do awarii, zaczynając od 15 minut przed jej odzyskaniem. Rozbił się około 19 czerwca, 09:04 CDT, i odzyskaliśmy go o 19 czerwca, 16:26 CDT. Patrzyłem na dzienniki w tym okresie, ale widzę wszystko normalnie, ta linia: Jun 19 09:06:04 userid sshd[8**]: Accepted publickey for *** from 192.168.*.* port 5**** ssh2: RSA SHA256:**ale w tym czasie ja ręcznie próbował ssh z tego samego adresu IP 192.168. *. * i dostawał „odmówiono portu 22 ..”
kwanta
... również nasz automatyczny transfer danych zawiódł. Dlaczego dzienniki nie pokazują niczego złego? Sprawdziłem również, że less /var/log/auth.log.1ostatni wpis był 17 czerwca. Inne sugerowane dzienniki są puste. Niestety nie mogę wykonać fizycznego rozruchu USB, ponieważ laptop jest w Stanach Zjednoczonych, a ja jestem gdzie indziej i nikogo tam nie ma.
kwanty
Nie mam teraz żadnych innych pomysłów, więc może to problem z siecią?
Shadowcoder,
Mogę pomyślnie pingować laptopa, aby sieć z pewnością działała, a laptop na pewno nie śpi, ale nie jest w stanie ssh!
kwanty
Mam Raspberry Pi, który robi to, co mówisz, że robi Twój serwer SSH na twoim laptopie. Tylko mój problem został naprawiony przez proste ponowne uruchomienie. Czy możesz zrzucić kilka dzienników z informacjami dotyczącymi serwera SSH? Opublikuj je w edycji swojego pytania. Czy w tym miesiącu zaczęło się to dziać, czy zastosowałeś aktualizacje lub miałeś awarię laptopa (co mogło coś zepsuć)?
Shadowcoder