Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 10/11/2023, à 04:07

Nick_L.

Comment installer GPU Direct Storage et CUDA

Bonjour à la communauté,
j'essaie depuis plusieurs jour d'installer CUDA sur ma machine ASUS N56VZ.
Et un prérequis étais ou est je pense d'installer le GPU Direct Storage. Mais je ne sais pas si je peux le faire par rapport aux spécificités de mon matériel.
Il me faut installer le MLNX_OFED et c'est la que ça coince. Je ne sais pas si je peux le faire. J'ai fais des recherche à propos je pense que c'est un pilote réseau mais je n'ai pas d'adaptateur Mellanox. Je ne sais donc pas si je dois l'installer ou pas.
Aussi, je suis étudiant et les exams c'est pour bientôt, j'ai pas envie de faire une fausse manoeuvre et de me retrouver avec un ubuntu en mode recovery, donc je suis prudent. Merci de m'éclairer.

Hors ligne

#2 Le 13/11/2023, à 03:36

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

Salut à tous.
Après plusieurs recherches et réflexions, j'ai fini par comprendre que Mellanox c'était une carte réseau lol;. Mais je n'ai pas toujours réussi à installer CUDA.

Voici comme n'ai procédé et ce que j'ai compris de tout ça.
Tout d'abord je veux absolution activer le GDS sur mon système et puis cela, je devais utiliser des pilotes de type : nvidia-kernel-open-<branch>.
Je n'arrive pas à l'installer avec la commande

sudo apt-get install nvidia-kernel-open-520

. Cela ne fait vraisemblablement pas partie des dépots apt, c'était quand-même un peu prévisible.
Quand je tente d'installer CUDA par le script par cette commande :

bash ./cuda_12.3.0_545.23.06_linux.run -m=kernel-open

L'option  -m  c'est pour installer les Open GPU Kernel Modules, ce qu'il faut je pense pour faire du GDS je pense...
mais on me retourne des erreurs, que je soit en utilisateur nick_l ou en root.

Quand je le fais en utilisateur ordinaire, voila ce qui m'est retourné:

(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ sudo bash ./cuda_12.3.0_545.23.06_linux.run -m=kernel-open
[sudo] Mot de passe de nick_l : 
 Installation failed. See log at /var/log/cuda-installer.log for details.

le mon fichier /var/log/cuda-installer.log affiche:

(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ cat /var/log/cuda-installer.log
[INFO]: Adding driver option -m=kernel-open
[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc

[INFO]: gcc version: gcc version 11.4.0 (Ubuntu 11.4.0-1ubuntu1~22.04) 

[INFO]: Initializing menu
[INFO]: nvidia-fs.setKOVersion(2.18.3)
[INFO]: Setup complete
[INFO]: Installing: Driver
[INFO]: Installing: 545.23.06
[INFO]: Executing NVIDIA-Linux-x86_64-545.23.06.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd --kernel-module-build-directory=kernel-open  2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed. Consult the driver log at /var/log/nvidia-installer.log for more details.
[ERROR]: Install of 545.23.06 failed, quitting


Et puis quand je le fais avec l'utilisateur root même, voila ce qui m'est retourné:

root@TeslaSQ-N56VM:/home/nick_l/Téléchargements/packages/nvidia# bash cuda_12.3.0_545.23.06_linux.run -m=kernel-open
 Installation failed. See log at /var/log/cuda-installer.log for details.

le mon fichier /var/log/cuda-installer.log affiche:

root@TeslaSQ-N56VM:/home/nick_l/Téléchargements/packages/nvidia# cat /var/log/nvidia-installer.log
nvidia-installer log file '/var/log/nvidia-installer.log'
creation time: Mon Nov 13 03:28:04 2023
installer version: 545.23.06

PATH: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin

nvidia-installer command line:
    ./nvidia-installer
    --ui=none
    --no-questions
    --accept-license
    --disable-nouveau
    --no-cc-version-check
    --install-libglvnd
    --kernel-module-build-directory=kernel-open

Using built-in stream user interface
-> Detected 8 CPUs online; setting concurrency level to 8.
-> Scanning the initramfs with lsinitramfs...
-> Executing: /usr/bin/lsinitramfs   -l /boot/initrd.img-6.2.0-36-generic
WARNING: The NVIDIA GeForce GT 650M GPU installed in this system is supported through the NVIDIA 470.xx legacy Linux graphics drivers.  Please visit http://www.nvidia.com/object/unix.html for more information.  The 545.23.06 NVIDIA Linux graphics driver will ignore this GPU.
WARNING: You do not appear to have an NVIDIA GPU supported by the 545.23.06 NVIDIA Linux graphics driver installed in this system.  For further details, please see the appendix SUPPORTED NVIDIA GRAPHICS CHIPS in the README available on the Linux driver download page at www.nvidia.com.
-> The file '/tmp/.X0-lock' exists and appears to contain the process ID '2420' of a running X server.
-> You appear to be running an X server.  Installing the NVIDIA driver while X is running is not recommended, as doing so may prevent the installer from detecting some potential installation problems, and it may not be possible to start new graphics applications after a new driver is installed.  If you choose to continue installation, it is highly recommended that you reboot your computer after installation to use the newly installed driver. (Answer: Abort installation)
ERROR: Installation has failed.  Please see the file '/var/log/nvidia-installer.log' for details.  You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.

S'il vous plaît, aidez moi à comprendre ce qui se passe. J'ai même essayé de l'installer avec les pilotes nvidia installé au préalable mais l'installeur m'a notifié qu'il est fortement recommandé de retirer d'abord les pilotes nvidia avant d'installer CUDA. Vraiment je n'y comprend plus rien.
S'il vous plaît besoin d'aide.

Hors ligne

#3 Le 13/11/2023, à 07:55

xubu1957

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,

Montre, en te servant du Retour utilisable de commande :

lspci -vnn | grep -A 12 '\''[030[02]\]' | grep -Ei "vga|3d|display|kernel"
ubuntu-drivers devices
uname -a
xrandr
dpkg -l | grep nvidia
dpkg -l | grep -v ^ii

et :

echo $XDG_SESSION_TYPE

pour voir si c'est Wayland ou x11.


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

En ligne

#4 Le 14/11/2023, à 04:03

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ lspci -vnn | grep -A 12 '\''[030[02]\]' | grep -Ei "vga|3d|display|kernel"
00:02.0 VGA compatible controller [0300]: Intel Corporation 3rd Gen Core processor Graphics Controller [8086:0166] (rev 09) (prog-if 00 [VGA controller])
	Kernel driver in use: i915
	Kernel modules: i915
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GK107M [GeForce GT 650M] [10de:0fd1] (rev a1) (prog-if 00 [VGA controller])
	Kernel driver in use: nouveau
	Kernel modules: nvidiafb, nouveau
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000FD1sv00001043sd00002103bc03sc00i00
vendor   : NVIDIA Corporation
model    : GK107M [GeForce GT 650M] (N56VZ)
driver   : nvidia-driver-418-server - distro non-free
driver   : nvidia-driver-390 - distro non-free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ uname -a
Linux TeslaSQ-N56VM 6.2.0-36-generic #37~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Mon Oct  9 15:34:04 UTC 2 x86_64 x86_64 x86_64 GNU/Linux
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ xrandr
Screen 0: minimum 16 x 16, current 1920 x 1080, maximum 32767 x 32767
XWAYLAND0 connected primary 1920x1080+0+0 (normal left inverted right x axis y axis) 340mm x 190mm
   1920x1080     59.88*+
   1440x1080     59.87  
   1400x1050     59.86  
   1280x1024     59.81  
   1280x960      59.79  
   1152x864      59.78  
   1024x768      59.68  
   800x600       59.47  
   640x480       59.38  
   320x240       59.52  
   1680x1050     59.85  
   1440x900      59.89  
   1280x800      59.81  
   720x480       59.71  
   640x400       59.20  
   320x200       58.96  
   1600x900      59.82  
   1368x768      59.71  
   1280x720      59.86  
   1024x576      59.58  
   864x486       59.45  
   720x400       59.55  
   640x350       58.91
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ dpkg -l | grep nvidia
rc  libnvidia-compute-390:i386                 390.157-0ubuntu0.22.04.2                   i386         NVIDIA libcompute package
ii  libnvidia-compute-418-server:i386          418.226.00-0ubuntu5~0.22.04.1              i386         NVIDIA libcompute package
ii  libnvidia-decode-418-server:i386           418.226.00-0ubuntu5~0.22.04.1              i386         NVIDIA Video Decoding runtime libraries
ii  libnvidia-encode-418-server:i386           418.226.00-0ubuntu5~0.22.04.1              i386         NVENC Video Encoding runtime library
ii  libnvidia-fbc1-418-server:i386             418.226.00-0ubuntu5~0.22.04.1              i386         NVIDIA OpenGL-based Framebuffer Capture runtime library
ii  screen-resolution-extra                    0.18.2                                     all          Extension for the nvidia-settings control panel
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ dpkg -l | grep -v ^ii
Souhait=inconnU/Installé/suppRimé/Purgé/H=à garder
| État=Non/Installé/fichier-Config/dépaqUeté/échec-conFig/H=semi-installé/W=attend-traitement-déclenchements
|/ Err?=(aucune)/besoin Réinstallation (État,Err: majuscule=mauvais)
||/ Nom                                        Version                                    Architecture Description
+++-==========================================-==========================================-============-================================================================================
rc  flatpak                                    1.12.7-1                                   amd64        Application deployment framework for desktop apps
rc  libnvidia-compute-390:i386                 390.157-0ubuntu0.22.04.2                   i386         NVIDIA libcompute package
rc  linux-image-5.15.0-43-generic              5.15.0-43.46                               amd64        Signed kernel image generic
rc  linux-image-5.19.0-43-generic              5.19.0-43.44~22.04.1                       amd64        Signed kernel image generic
rc  linux-image-5.19.0-45-generic              5.19.0-45.46~22.04.1                       amd64        Signed kernel image generic
rc  linux-image-5.19.0-46-generic              5.19.0-46.47~22.04.1                       amd64        Signed kernel image generic
rc  linux-image-5.19.0-50-generic              5.19.0-50.50                               amd64        Signed kernel image generic
rc  linux-image-6.2.0-26-generic               6.2.0-26.26~22.04.1                        amd64        Signed kernel image generic
rc  linux-image-6.2.0-31-generic               6.2.0-31.31~22.04.1                        amd64        Signed kernel image generic
rc  linux-image-6.2.0-34-generic               6.2.0-34.34~22.04.1                        amd64        Signed kernel image generic
rc  linux-modules-5.15.0-43-generic            5.15.0-43.46                               amd64        Linux kernel extra modules for version 5.15.0 on 64 bit x86 SMP
rc  linux-modules-5.19.0-43-generic            5.19.0-43.44~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-5.19.0-45-generic            5.19.0-45.46~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-5.19.0-46-generic            5.19.0-46.47~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-5.19.0-50-generic            5.19.0-50.50                               amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-6.2.0-26-generic             6.2.0-26.26~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  linux-modules-6.2.0-31-generic             6.2.0-31.31~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  linux-modules-6.2.0-34-generic             6.2.0-34.34~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  linux-modules-extra-5.15.0-43-generic      5.15.0-43.46                               amd64        Linux kernel extra modules for version 5.15.0 on 64 bit x86 SMP
rc  linux-modules-extra-5.19.0-43-generic      5.19.0-43.44~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-extra-5.19.0-45-generic      5.19.0-45.46~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-extra-5.19.0-46-generic      5.19.0-46.47~22.04.1                       amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-extra-5.19.0-50-generic      5.19.0-50.50                               amd64        Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc  linux-modules-extra-6.2.0-26-generic       6.2.0-26.26~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  linux-modules-extra-6.2.0-31-generic       6.2.0-31.31~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  linux-modules-extra-6.2.0-34-generic       6.2.0-34.34~22.04.1                        amd64        Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc  virtualbox-7.0                             7.0.10-158379~Ubuntu~jammy                 amd64        Oracle VM VirtualBox
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ echo $XDG_SESSION_TYPE
wayland

Hors ligne

#5 Le 14/11/2023, à 07:53

xubu1957

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,

Pour purger les résidus de configuration marqués "rc" :

sudo apt purge ~c

comme expliqué à la machine à café et rajouté dans ce message

Vu :

driver   : nvidia-driver-390 - distro non-free recommended

Tu avais testé avec le pilote nvidia-driver-390 conseillé ?

Pour passer du pilote nouveau, au pilote nvidia-driver-390, tente :

sudo apt purge nvidia*
sudo ubuntu-drivers autoinstall

Suivi d’un redémarrage.

La Doc gestionnaire_de_pilotes_proprietaires


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

En ligne

#6 Le 19/11/2023, à 02:54

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

Oui je l'avais installé. Mais j'avais d'abord essayé avec le nvidia-driver-418-server qui était de mon point de vu plus adapté à mes attentes. Mais l'installation s'accompagnait d'un message d'erreur. Mais était quand même pris en compte par le système après redémarrage.
Et puis lorsque j'ai mis le nvidia-driver-390 les fonctionnalités d’accessibilité que j'avais avec mon pavé tactile pour passer par exemple d'un bureau à un autre ne fonctionnait plus. Et en plus je me rend sur le site de cuda et je lis encore bien et comprend qui normalement pour réaliser le GPU Direct Storage je dois installer des pilotes comme ceux-ci nvidia-kernel-open-520.
Pilote que j'ai essayé donc d' installer par le script d'installation de cuda ( le run file) directement en le lançant comme suit :

sh cuda_<release>_<version>_linux.run -m=kernel-open

mais quand je valide l'installation des erreurs se produisent comme présenté plus haut.
Je vais quand même d'abord purger les résidus de configuration et réessayer.
Bon et aussi que après avoir installé tout ces pilotes  (390 et puis 418) je les ai encore supprimé car l'installateur de cuda me conseillait que le faire hmm

Hors ligne

#7 Le 19/11/2023, à 03:12

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

Je pense que on essaye de me dire que le pilote que cuda essaye de m'installer 545.23.06 n'est pas le bon pour ma carte graphique, et donc il est tout simplement rejeté. Je vais installer un pilote manuellement et installer cuda avec, faisant fi de leurs recommandation et conseil.

Hors ligne

#8 Le 19/11/2023, à 07:40

xubu1957

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,

Je lis dans askubuntu.com/questions/1492831/cuda-on-wayland-just-computation-no-graphics

Le 16/11/2023, Thomas Ward a écrit :

Wayland casse les pilotes GPU. Votre carte Intel nécessite des graphiques NVidia entièrement fonctionnels, car c'est ainsi qu'elle passe de CUDA/NVIDIA aux graphiques alimentés par le processeur Intel. Désactivez Wayland si vous avez l’intention de le faire. Ou, si vous n'avez pas du tout l'intention d'utiliser une interface graphique, installez plutôt le serveur et installez-y vos pilotes en conséquence.

Pour changer de session avec la roue crantée, pour tester avec xorg, regarde l'EDIT de malbo dans ce message (ou le début du message #8, citant nany).


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

En ligne

#9 Le 19/11/2023, à 12:34

inbox

Re : Comment installer GPU Direct Storage et CUDA

Salut,

Il  faut lire les fichiers de log attentivement. L'explication du problème y est indiquée en toutes lettres :

Log Nvidia a écrit :

WARNING: The NVIDIA GeForce GT 650M GPU installed in this system is supported through the NVIDIA 470.xx legacy Linux graphics drivers.  Please visit http://www.nvidia.com/object/unix.html for more information.  The 545.23.06 NVIDIA Linux graphics driver will ignore this GPU.
WARNING: You do not appear to have an NVIDIA GPU supported by the 545.23.06 NVIDIA Linux graphics driver installed in this system.

En résumé ton GPU n'est pas supporté par le pilote que tu tentes d'installer. Ton GPU est supporté par le pilote 470.xx et probablement par le 490.xx.

A+


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#10 Le 21/11/2023, à 05:15

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,

oui exactement. Je suis allé dans les archives de CUDA télécharger une version antérieur qui installe le pilote 470.92.1 . Je pense que avec ça, ça devrait marcher.
Xubu, j'ai peur de mal comprendre mais la session dont tu parles c'est le Snapd User Session Agent ?
Aussi j'ai une petite préoccupation, les commandes à 3 doigts sur le pavé tactile qui permettent de passer par exemple d'un bureau à l'autre d'un seul geste ne marchent plus. J'ai remarqué que cela dépendait de quel pilote était installé et utilisé à un moment donné. J'aimerai bien pouvoir retrouver cette fonctionnalité là. Pourquoi ça se comporte ainsi.

Hors ligne

#11 Le 21/11/2023, à 07:30

xubu1957

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,

Je parlais de :

Le 24/04/2023, nany a écrit :

Bonjour,

La roue crantée n’apparaît que lorsqu’on clique sur le nom d’utilisateur.
Écran d’accueil avant clic.
Écran d’accueil après clic.
La roue crantée se trouve en bas à droite.

Montre :

xinput list

Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

En ligne

#12 Le 22/11/2023, à 04:29

Nick_L.

Re : Comment installer GPU Direct Storage et CUDA

Bonjour,
Voici ce que on me renvoi :

(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ xinput list
⎡ Virtual core pointer                    	id=2	[master pointer  (3)]
⎜   ↳ Virtual core XTEST pointer              	id=4	[slave  pointer  (2)]
⎜   ↳ ETPS/2 Elantech Touchpad                	id=14	[slave  pointer  (2)]
⎣ Virtual core keyboard                   	id=3	[master keyboard (2)]
    ↳ Virtual core XTEST keyboard             	id=5	[slave  keyboard (3)]
    ↳ Power Button                            	id=6	[slave  keyboard (3)]
    ↳ Asus Wireless Radio Control             	id=7	[slave  keyboard (3)]
    ↳ Video Bus                               	id=8	[slave  keyboard (3)]
    ↳ Video Bus                               	id=9	[slave  keyboard (3)]
    ↳ Sleep Button                            	id=10	[slave  keyboard (3)]
    ↳ ASUS USB2.0 Webcam: ASUS USB2.0         	id=11	[slave  keyboard (3)]
    ↳ Asus WMI hotkeys                        	id=12	[slave  keyboard (3)]
    ↳ AT Translated Set 2 keyboard            	id=13	[slave  keyboard (3)]

Hors ligne