#1 Le 10/11/2023, à 04:07
- Nick_L.
Comment installer GPU Direct Storage et CUDA
Bonjour à la communauté,
j'essaie depuis plusieurs jour d'installer CUDA sur ma machine ASUS N56VZ.
Et un prérequis étais ou est je pense d'installer le GPU Direct Storage. Mais je ne sais pas si je peux le faire par rapport aux spécificités de mon matériel.
Il me faut installer le MLNX_OFED et c'est la que ça coince. Je ne sais pas si je peux le faire. J'ai fais des recherche à propos je pense que c'est un pilote réseau mais je n'ai pas d'adaptateur Mellanox. Je ne sais donc pas si je dois l'installer ou pas.
Aussi, je suis étudiant et les exams c'est pour bientôt, j'ai pas envie de faire une fausse manoeuvre et de me retrouver avec un ubuntu en mode recovery, donc je suis prudent. Merci de m'éclairer.
Hors ligne
#2 Le 13/11/2023, à 03:36
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
Salut à tous.
Après plusieurs recherches et réflexions, j'ai fini par comprendre que Mellanox c'était une carte réseau ;. Mais je n'ai pas toujours réussi à installer CUDA.
Voici comme n'ai procédé et ce que j'ai compris de tout ça.
Tout d'abord je veux absolution activer le GDS sur mon système et puis cela, je devais utiliser des pilotes de type : nvidia-kernel-open-<branch>.
Je n'arrive pas à l'installer avec la commande
sudo apt-get install nvidia-kernel-open-520
. Cela ne fait vraisemblablement pas partie des dépots apt, c'était quand-même un peu prévisible.
Quand je tente d'installer CUDA par le script par cette commande :
bash ./cuda_12.3.0_545.23.06_linux.run -m=kernel-open
L'option -m c'est pour installer les Open GPU Kernel Modules, ce qu'il faut je pense pour faire du GDS je pense...
mais on me retourne des erreurs, que je soit en utilisateur nick_l ou en root.
Quand je le fais en utilisateur ordinaire, voila ce qui m'est retourné:
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ sudo bash ./cuda_12.3.0_545.23.06_linux.run -m=kernel-open
[sudo] Mot de passe de nick_l :
Installation failed. See log at /var/log/cuda-installer.log for details.
le mon fichier /var/log/cuda-installer.log affiche:
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ cat /var/log/cuda-installer.log
[INFO]: Adding driver option -m=kernel-open
[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc
[INFO]: gcc version: gcc version 11.4.0 (Ubuntu 11.4.0-1ubuntu1~22.04)
[INFO]: Initializing menu
[INFO]: nvidia-fs.setKOVersion(2.18.3)
[INFO]: Setup complete
[INFO]: Installing: Driver
[INFO]: Installing: 545.23.06
[INFO]: Executing NVIDIA-Linux-x86_64-545.23.06.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd --kernel-module-build-directory=kernel-open 2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed. Consult the driver log at /var/log/nvidia-installer.log for more details.
[ERROR]: Install of 545.23.06 failed, quitting
Et puis quand je le fais avec l'utilisateur root même, voila ce qui m'est retourné:
root@TeslaSQ-N56VM:/home/nick_l/Téléchargements/packages/nvidia# bash cuda_12.3.0_545.23.06_linux.run -m=kernel-open
Installation failed. See log at /var/log/cuda-installer.log for details.
le mon fichier /var/log/cuda-installer.log affiche:
root@TeslaSQ-N56VM:/home/nick_l/Téléchargements/packages/nvidia# cat /var/log/nvidia-installer.log
nvidia-installer log file '/var/log/nvidia-installer.log'
creation time: Mon Nov 13 03:28:04 2023
installer version: 545.23.06
PATH: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin
nvidia-installer command line:
./nvidia-installer
--ui=none
--no-questions
--accept-license
--disable-nouveau
--no-cc-version-check
--install-libglvnd
--kernel-module-build-directory=kernel-open
Using built-in stream user interface
-> Detected 8 CPUs online; setting concurrency level to 8.
-> Scanning the initramfs with lsinitramfs...
-> Executing: /usr/bin/lsinitramfs -l /boot/initrd.img-6.2.0-36-generic
WARNING: The NVIDIA GeForce GT 650M GPU installed in this system is supported through the NVIDIA 470.xx legacy Linux graphics drivers. Please visit http://www.nvidia.com/object/unix.html for more information. The 545.23.06 NVIDIA Linux graphics driver will ignore this GPU.
WARNING: You do not appear to have an NVIDIA GPU supported by the 545.23.06 NVIDIA Linux graphics driver installed in this system. For further details, please see the appendix SUPPORTED NVIDIA GRAPHICS CHIPS in the README available on the Linux driver download page at www.nvidia.com.
-> The file '/tmp/.X0-lock' exists and appears to contain the process ID '2420' of a running X server.
-> You appear to be running an X server. Installing the NVIDIA driver while X is running is not recommended, as doing so may prevent the installer from detecting some potential installation problems, and it may not be possible to start new graphics applications after a new driver is installed. If you choose to continue installation, it is highly recommended that you reboot your computer after installation to use the newly installed driver. (Answer: Abort installation)
ERROR: Installation has failed. Please see the file '/var/log/nvidia-installer.log' for details. You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.
S'il vous plaît, aidez moi à comprendre ce qui se passe. J'ai même essayé de l'installer avec les pilotes nvidia installé au préalable mais l'installeur m'a notifié qu'il est fortement recommandé de retirer d'abord les pilotes nvidia avant d'installer CUDA. Vraiment je n'y comprend plus rien.
S'il vous plaît besoin d'aide.
Hors ligne
#3 Le 13/11/2023, à 07:55
- xubu1957
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
Montre, en te servant du Retour utilisable de commande :
lspci -vnn | grep -A 12 '\''[030[02]\]' | grep -Ei "vga|3d|display|kernel"
ubuntu-drivers devices
uname -a
xrandr
dpkg -l | grep nvidia
dpkg -l | grep -v ^ii
et :
echo $XDG_SESSION_TYPE
pour voir si c'est Wayland ou x11.
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
En ligne
#4 Le 14/11/2023, à 04:03
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ lspci -vnn | grep -A 12 '\''[030[02]\]' | grep -Ei "vga|3d|display|kernel"
00:02.0 VGA compatible controller [0300]: Intel Corporation 3rd Gen Core processor Graphics Controller [8086:0166] (rev 09) (prog-if 00 [VGA controller])
Kernel driver in use: i915
Kernel modules: i915
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GK107M [GeForce GT 650M] [10de:0fd1] (rev a1) (prog-if 00 [VGA controller])
Kernel driver in use: nouveau
Kernel modules: nvidiafb, nouveau
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000FD1sv00001043sd00002103bc03sc00i00
vendor : NVIDIA Corporation
model : GK107M [GeForce GT 650M] (N56VZ)
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-390 - distro non-free recommended
driver : xserver-xorg-video-nouveau - distro free builtin
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ uname -a
Linux TeslaSQ-N56VM 6.2.0-36-generic #37~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Mon Oct 9 15:34:04 UTC 2 x86_64 x86_64 x86_64 GNU/Linux
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ xrandr
Screen 0: minimum 16 x 16, current 1920 x 1080, maximum 32767 x 32767
XWAYLAND0 connected primary 1920x1080+0+0 (normal left inverted right x axis y axis) 340mm x 190mm
1920x1080 59.88*+
1440x1080 59.87
1400x1050 59.86
1280x1024 59.81
1280x960 59.79
1152x864 59.78
1024x768 59.68
800x600 59.47
640x480 59.38
320x240 59.52
1680x1050 59.85
1440x900 59.89
1280x800 59.81
720x480 59.71
640x400 59.20
320x200 58.96
1600x900 59.82
1368x768 59.71
1280x720 59.86
1024x576 59.58
864x486 59.45
720x400 59.55
640x350 58.91
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ dpkg -l | grep nvidia
rc libnvidia-compute-390:i386 390.157-0ubuntu0.22.04.2 i386 NVIDIA libcompute package
ii libnvidia-compute-418-server:i386 418.226.00-0ubuntu5~0.22.04.1 i386 NVIDIA libcompute package
ii libnvidia-decode-418-server:i386 418.226.00-0ubuntu5~0.22.04.1 i386 NVIDIA Video Decoding runtime libraries
ii libnvidia-encode-418-server:i386 418.226.00-0ubuntu5~0.22.04.1 i386 NVENC Video Encoding runtime library
ii libnvidia-fbc1-418-server:i386 418.226.00-0ubuntu5~0.22.04.1 i386 NVIDIA OpenGL-based Framebuffer Capture runtime library
ii screen-resolution-extra 0.18.2 all Extension for the nvidia-settings control panel
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ dpkg -l | grep -v ^ii
Souhait=inconnU/Installé/suppRimé/Purgé/H=à garder
| État=Non/Installé/fichier-Config/dépaqUeté/échec-conFig/H=semi-installé/W=attend-traitement-déclenchements
|/ Err?=(aucune)/besoin Réinstallation (État,Err: majuscule=mauvais)
||/ Nom Version Architecture Description
+++-==========================================-==========================================-============-================================================================================
rc flatpak 1.12.7-1 amd64 Application deployment framework for desktop apps
rc libnvidia-compute-390:i386 390.157-0ubuntu0.22.04.2 i386 NVIDIA libcompute package
rc linux-image-5.15.0-43-generic 5.15.0-43.46 amd64 Signed kernel image generic
rc linux-image-5.19.0-43-generic 5.19.0-43.44~22.04.1 amd64 Signed kernel image generic
rc linux-image-5.19.0-45-generic 5.19.0-45.46~22.04.1 amd64 Signed kernel image generic
rc linux-image-5.19.0-46-generic 5.19.0-46.47~22.04.1 amd64 Signed kernel image generic
rc linux-image-5.19.0-50-generic 5.19.0-50.50 amd64 Signed kernel image generic
rc linux-image-6.2.0-26-generic 6.2.0-26.26~22.04.1 amd64 Signed kernel image generic
rc linux-image-6.2.0-31-generic 6.2.0-31.31~22.04.1 amd64 Signed kernel image generic
rc linux-image-6.2.0-34-generic 6.2.0-34.34~22.04.1 amd64 Signed kernel image generic
rc linux-modules-5.15.0-43-generic 5.15.0-43.46 amd64 Linux kernel extra modules for version 5.15.0 on 64 bit x86 SMP
rc linux-modules-5.19.0-43-generic 5.19.0-43.44~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-5.19.0-45-generic 5.19.0-45.46~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-5.19.0-46-generic 5.19.0-46.47~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-5.19.0-50-generic 5.19.0-50.50 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-6.2.0-26-generic 6.2.0-26.26~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc linux-modules-6.2.0-31-generic 6.2.0-31.31~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc linux-modules-6.2.0-34-generic 6.2.0-34.34~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc linux-modules-extra-5.15.0-43-generic 5.15.0-43.46 amd64 Linux kernel extra modules for version 5.15.0 on 64 bit x86 SMP
rc linux-modules-extra-5.19.0-43-generic 5.19.0-43.44~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-extra-5.19.0-45-generic 5.19.0-45.46~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-extra-5.19.0-46-generic 5.19.0-46.47~22.04.1 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-extra-5.19.0-50-generic 5.19.0-50.50 amd64 Linux kernel extra modules for version 5.19.0 on 64 bit x86 SMP
rc linux-modules-extra-6.2.0-26-generic 6.2.0-26.26~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc linux-modules-extra-6.2.0-31-generic 6.2.0-31.31~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc linux-modules-extra-6.2.0-34-generic 6.2.0-34.34~22.04.1 amd64 Linux kernel extra modules for version 6.2.0 on 64 bit x86 SMP
rc virtualbox-7.0 7.0.10-158379~Ubuntu~jammy amd64 Oracle VM VirtualBox
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ echo $XDG_SESSION_TYPE
wayland
Hors ligne
#5 Le 14/11/2023, à 07:53
- xubu1957
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
Pour purger les résidus de configuration marqués "rc" :
sudo apt purge ~c
comme expliqué à la machine à café et rajouté dans ce message
Vu :
driver : nvidia-driver-390 - distro non-free recommended
Tu avais testé avec le pilote nvidia-driver-390 conseillé ?
Pour passer du pilote nouveau, au pilote nvidia-driver-390, tente :
sudo apt purge nvidia*
sudo ubuntu-drivers autoinstall
Suivi d’un redémarrage.
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
En ligne
#6 Le 19/11/2023, à 02:54
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
Oui je l'avais installé. Mais j'avais d'abord essayé avec le nvidia-driver-418-server qui était de mon point de vu plus adapté à mes attentes. Mais l'installation s'accompagnait d'un message d'erreur. Mais était quand même pris en compte par le système après redémarrage.
Et puis lorsque j'ai mis le nvidia-driver-390 les fonctionnalités d’accessibilité que j'avais avec mon pavé tactile pour passer par exemple d'un bureau à un autre ne fonctionnait plus. Et en plus je me rend sur le site de cuda et je lis encore bien et comprend qui normalement pour réaliser le GPU Direct Storage je dois installer des pilotes comme ceux-ci nvidia-kernel-open-520.
Pilote que j'ai essayé donc d' installer par le script d'installation de cuda ( le run file) directement en le lançant comme suit :
sh cuda_<release>_<version>_linux.run -m=kernel-open
mais quand je valide l'installation des erreurs se produisent comme présenté plus haut.
Je vais quand même d'abord purger les résidus de configuration et réessayer.
Bon et aussi que après avoir installé tout ces pilotes (390 et puis 418) je les ai encore supprimé car l'installateur de cuda me conseillait que le faire
Hors ligne
#7 Le 19/11/2023, à 03:12
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
Je pense que on essaye de me dire que le pilote que cuda essaye de m'installer 545.23.06 n'est pas le bon pour ma carte graphique, et donc il est tout simplement rejeté. Je vais installer un pilote manuellement et installer cuda avec, faisant fi de leurs recommandation et conseil.
Hors ligne
#8 Le 19/11/2023, à 07:40
- xubu1957
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
Je lis dans askubuntu.com/questions/1492831/cuda-on-wayland-just-computation-no-graphics
Wayland casse les pilotes GPU. Votre carte Intel nécessite des graphiques NVidia entièrement fonctionnels, car c'est ainsi qu'elle passe de CUDA/NVIDIA aux graphiques alimentés par le processeur Intel. Désactivez Wayland si vous avez l’intention de le faire. Ou, si vous n'avez pas du tout l'intention d'utiliser une interface graphique, installez plutôt le serveur et installez-y vos pilotes en conséquence.
Pour changer de session avec la roue crantée, pour tester avec xorg, regarde l'EDIT de malbo dans ce message (ou le début du message #8, citant nany).
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
En ligne
#9 Le 19/11/2023, à 12:34
- inbox
Re : Comment installer GPU Direct Storage et CUDA
Salut,
Il faut lire les fichiers de log attentivement. L'explication du problème y est indiquée en toutes lettres :
WARNING: The NVIDIA GeForce GT 650M GPU installed in this system is supported through the NVIDIA 470.xx legacy Linux graphics drivers. Please visit http://www.nvidia.com/object/unix.html for more information. The 545.23.06 NVIDIA Linux graphics driver will ignore this GPU.
WARNING: You do not appear to have an NVIDIA GPU supported by the 545.23.06 NVIDIA Linux graphics driver installed in this system.
En résumé ton GPU n'est pas supporté par le pilote que tu tentes d'installer. Ton GPU est supporté par le pilote 470.xx et probablement par le 490.xx.
A+
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#10 Le 21/11/2023, à 05:15
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
oui exactement. Je suis allé dans les archives de CUDA télécharger une version antérieur qui installe le pilote 470.92.1 . Je pense que avec ça, ça devrait marcher.
Xubu, j'ai peur de mal comprendre mais la session dont tu parles c'est le Snapd User Session Agent ?
Aussi j'ai une petite préoccupation, les commandes à 3 doigts sur le pavé tactile qui permettent de passer par exemple d'un bureau à l'autre d'un seul geste ne marchent plus. J'ai remarqué que cela dépendait de quel pilote était installé et utilisé à un moment donné. J'aimerai bien pouvoir retrouver cette fonctionnalité là. Pourquoi ça se comporte ainsi.
Hors ligne
#11 Le 21/11/2023, à 07:30
- xubu1957
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
Je parlais de :
Bonjour,
La roue crantée n’apparaît que lorsqu’on clique sur le nom d’utilisateur.
Écran d’accueil avant clic.
Écran d’accueil après clic.
La roue crantée se trouve en bas à droite.
Montre :
xinput list
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
En ligne
#12 Le 22/11/2023, à 04:29
- Nick_L.
Re : Comment installer GPU Direct Storage et CUDA
Bonjour,
Voici ce que on me renvoi :
(base) nick_l@TeslaSQ-N56VM:~/Téléchargements/packages/nvidia$ xinput list
⎡ Virtual core pointer id=2 [master pointer (3)]
⎜ ↳ Virtual core XTEST pointer id=4 [slave pointer (2)]
⎜ ↳ ETPS/2 Elantech Touchpad id=14 [slave pointer (2)]
⎣ Virtual core keyboard id=3 [master keyboard (2)]
↳ Virtual core XTEST keyboard id=5 [slave keyboard (3)]
↳ Power Button id=6 [slave keyboard (3)]
↳ Asus Wireless Radio Control id=7 [slave keyboard (3)]
↳ Video Bus id=8 [slave keyboard (3)]
↳ Video Bus id=9 [slave keyboard (3)]
↳ Sleep Button id=10 [slave keyboard (3)]
↳ ASUS USB2.0 Webcam: ASUS USB2.0 id=11 [slave keyboard (3)]
↳ Asus WMI hotkeys id=12 [slave keyboard (3)]
↳ AT Translated Set 2 keyboard id=13 [slave keyboard (3)]
Hors ligne