akcje nfs i cifs zawieszone na Linuksie

3

Mam serwer NAS (Dlink DNS-323), który montuję z mojego linuxa. Kiedyś działało dobrze, a potem zaktualizowałem moją dystrybucję (apt-get upgrade). Używam Linux Mint Debian Edition. Aktualne jądro to:

oliver@astro ~ $ uname -a
Linux astro 3.11-2-amd64 #1 SMP Debian 3.11.8-1 (2013-11-13) x86_64 GNU/Linux

Zamontowałem go jako część CIFS za pomocą autofs, ale po aktualizacji stał się problematyczny. W szczególności mogłem zamontować udział, ale jeśli szybko go przeczytałem i / lub do niego napisałem, zawiesiłoby się i zwróciło wiele błędów. Na przykład, otwarcie folderu z wieloma obrazkami w gThumb, a następnie szybkie kliknięcie przycisku „następny”, zazwyczaj powoduje zawieszenie. Po zawieszeniu żadne programy (w tym ls, lsof, fuser, narzędzia graficznego systemu plików itp.) Nie mogą uzyskać dostępu do udziału - wszystkie się zawieszają. Jednak czytanie i / lub pisanie do udziału „powoli” jest w porządku.

Próbowałem bardzo wielu różnych poprawek, w tym:

  • Wiele różnych opcji montażu. Zbyt wiele, aby zapamiętać je wszystkie, ale niektóre z nich to nounix, sec = ntlm, sec = ntlmv2, itd.
  • Montowanie jako udział nfs zamiast udziału CIFS
  • Montowanie przez / etc / fstab zamiast autofs. Próbowałem tego zarówno dla cifs, jak i nfs

Wszyscy mają to samo zachowanie. Problemem nie jest sam NAS, ponieważ nadal działa dobrze z innych komputerów w domu. Problemem nie jest również karta sieciowa w tym urządzeniu, ponieważ mogę przeglądać strony internetowe, oglądać filmy itp. Z niego w porządku. To wydaje się być specyficzne dla mojej maszyny Mint. Oto wiersz w moim bieżącym / etc / fstab, którego używam do zamontowania udziału przez cifs:

//192.168.0.3/Volume_1  /media/dlink    cifs    guest,rw,uid=oliver,gid=oliver,nounix,sec=ntlm  0   0

A oto odpowiednia linia z / etc / mtab:

//192.168.0.3/Volume_1 /media/dlink cifs rw,relatime,vers=1.0,sec=ntlm,cache=strict,uid=1000,forceuid,gid=1000,forcegid,addr=192.168.0.3,file_mode=0755,dir_mode=0755,nounix,serverino,rsize=61440,wsize=65536,actimeo=1 0 0

Najczęstszym błędem, który widzę w / var / log / syslog, jest:

Feb 19 17:01:47 localhost kernel: [  276.258055] CIFS VFS: Server 192.168.0.3 has not responded in 120 seconds. Reconnecting...

Jest to zdecydowanie najbardziej powszechne i ogólnie to wszystko, co widzę. W niektórych punktach widziałem inne komunikaty o błędach, chociaż obawiam się, że nie mogę ich odtworzyć w tym momencie.

Jeszcze jedna wskazówka. Wygląda na to, że po otrzymaniu błędów na dysku zwykle widzę następujące informacje w / var / log / syslog:

Feb 19 17:04:57 localhost minissdpd[4451]: 12 new devices added
Feb 19 17:05:01 localhost minissdpd[4451]: 1 new devices added

Wiem, że minissdpd jest rzeczą UPnP i nie powinien mieć z tym nic wspólnego. Może to być czerwony śledź, ale widzę to tak często po tym, jak mam problemy i zazwyczaj nie widzę tego inaczej, więc pomyślałem, że o tym wspomnę.

Jakieś pomysły??

Oliver Dain
źródło

Odpowiedzi:

2

Po wielu debugowaniach i przeglądaniu zrzutów pakietów prześledziłem ten problem w sterowniku karty sieciowej. Bufor kart sieciowych przepełnił się, więc stos TCP wciąż myślał, że pakiety zniknęły. Przełączanie kart sieciowych rozwiązało problem.

Oliver Dain
źródło