NVIDIA-SMI nie powiodło się, ponieważ nie mógł się komunikować ze sterownikiem NVIDIA. Upewnij się, że najnowszy sterownik NVIDIA jest zainstalowany i uruchomiony

23

Właśnie zainstalowałem CUDA w takim notebooku:

sudo apt-get install cuda

Jak powiedziałem tutaj .

Kompilowanie wokalistów jest w porządku, ale kiedy próbuję uruchomić, mam następujący problem: błąd CUDA w pliku file.cu:128 = 35 (cudaErrorInsufficientDriver) „cudaStreamCreate (& (stream [i]))”

Moja wersja nvcc:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Informacje o karcie graficznej:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Zainstalowałem także VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Po tym .

Kiedy próbuję uruchomić coś na trzmiele, mam to: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

sterownik nvidia nie działa.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Wygląda na to, że wersja NVIDIA 375 jest zainstalowana, ale nie mogę sprawić, żeby działała.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

I trochę informacji o kierowcy.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Myślę, że może to być problem z wersją sterownika:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

czego mi brakuje?

Rodolfo
źródło
jak instalujesz sterowniki?
Charlie Parker,
Wystąpił ten sam błąd i żadna z odpowiedzi nie zadziałała. Co nie działa była prosta $ reboot now.
darthbhyrava

Odpowiedzi:

14

Jeśli nvidia-sminie udało się nawiązać komunikacji, ale sterownik został zainstalowany tyle razy, sprawdź prime-select.

  1. Uruchom, prime-select queryaby uzyskać wszystkie możliwe opcje. Powinieneś zobaczyć przynajmniej nvidia | intel.
  2. Wybierz prime-select nvidia.
  3. Jeśli to mówi nvidia is already selected, wybierz inny, np. prime-select intelNastępnie wróć do nvidiiprime-select nvidia
  4. Uruchom ponownie i sprawdź nvidia-smi.
Phúc Lê
źródło
Pomogło mi. Dzięki!
Yaroslav Schubert
1
oh, prime-select querynawet nie
wymieniłem danych
11

Możesz zainstalować pakiet narzędzi Cuda. Aby zainstalować, użyj następującego polecenia.

sudo apt install nvidia-cuda-toolkit

Po zakończeniu instalacji uruchom ponownie komputer. nvidia-smipowinno działać.

Jack Chan
źródło
pracuje dla mnie !!
x0v
To działa dla mnie
niedziela
6
Tu nie działało
Bill Kotsias,
2
nie rób tego, jeśli masz cuda> = 10. Spowoduje to obniżenie twojego cuda do 9, który jest obecnie dostępny na Ubuntu bez CUDA PPA.
loretoparisi
Robiąc sudo apt-get purge nvidia-*wcześniej, to powyższa linia naprawiła wszystko, co dotyczyło dla mnie CUDA, zainstalowałem sterownik 430 z CUDA 10.1
Dinari
6

Wyłączyłem Bezpieczny rozruch i działał całkiem dobrze.

@ rod-Smith odpowiedział na inne pytanie, bardziej szczegółowo wyjaśniające, jak to zrobić, w zasadzie jest to konfiguracja konfiguracji, ale napisał również dobry artykuł o tym, jak to zrobić tutaj .

Rodolfo
źródło
2
Pomogło mi to również ze sterownikiem nvidia 390! Nigdy nie myślałem, że może to być z powodu bezpiecznego rozruchu, dzięki :)
samutamm
Tryb UEFI z bezpiecznym uruchomieniem został już tutaj wykonany. =) Wygląda na to, że nie działa dla wszystkich, niestety.
Renan Willian Prado
3

ponieważ nie mogę skomentować powyższej odpowiedzi @ Rodolfo (niewystarczająca reputacja), dodaję nową odpowiedź.

Na moim komputerze musiałem skonfigurować Bezpieczny rozruch zgodnie z moim systemem operacyjnym. Mam płytę główną ASUS z systemem Ubuntu 18.04 i próbowałem zainstalować NVIDIA CUDA 10.1 Update 2 ze spakowanym sterownikiem NVIDIA. Napotkałem ten sam problem, jak opisano powyżej. Jak się okazało, Bezpieczny rozruch został ustawiony na tryb UEFI systemu Windows. Zmiana na inny system operacyjny naprawiła to dla mnie.

markus
źródło
1
Dzięki, musiałem wyłączyć, Secure Bootktóry został automatycznie ponownie włączony podczas automatycznej aktualizacji systemu Windows / BIOS !!! Teraz NVIDIA działa dobrze.
Bill Kotsias,
czy mógłbyś wyjaśnić, w jaki sposób zmieniłeś bezpieczny rozruch na inny system operacyjny ?
Inspi
1
@BillKotsias dzięki! : D
Marek
0

Dla przyszłych czytelników:

Jestem na instancji maszyny wirtualnej (Google Cloud Platform)

i śledzę tę istotę, aby zainstalować Cudai CuDNnna mojej maszynie wirtualnej.

Musiałem ręcznie przesłać CuDNnczęść. (Po prostu to tam zamieszczam.)

Przejdźmy teraz do błędu:

Miałem ten problem, ale kompletne ponowne uruchomienie instancji wykonało zadanie. I przez całkowite ponowne uruchomienie mam na myśli zatrzymanie instancji i ponowne włączenie jej.

Mam nadzieję, że to komuś pomoże.

Pramesh Bajracharya
źródło