grycap.nvidia_driver

ansible-role-nvidia-driver

Un rôle Ansible pour installer le pilote NVIDIA à partir des dépôts NVIDIA CUDA.

Exigences

Lors de l'installation du pilote NVIDIA, ce rôle va redémarrer les nœuds où il s'exécute. Pour cette raison, nous vous recommandons fortement d'exécuter ansible-playbook depuis un nœud différent de celui des nœuds GPU où vous installez le pilote.

Si vous essayez d'exécuter Ansible sur le même nœud que celui où vous installez le pilote, ce rôle fera soit :

  • Refuser de continuer avec une erreur comme Running reboot with local connection would reboot the control node (si exécuté avec la connexion local)
  • Redémarrer le nœud sur lequel vous exécutez, interrompant ainsi l'exécution du playbook ! (si exécuté avec une connexion ssh contre localhost)

Installation

Ce rôle peut être installé en utilisant Ansible Galaxy :

$ ansible-galaxy install grycap.nvidia_driver

Variables du rôle

Variable Valeur par défaut Description
nvidia_driver_package_version "" Version du paquet à installer. Notez que cela doit correspondre à la version réelle du paquet deb ou RPM à installer.
nvidia_driver_persistence_mode_on yes Indique si le mode de persistance doit être activé (booléen)
nvidia_driver_skip_reboot no Indique s'il faut ignorer le redémarrage du nœud pendant l'installation
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Nom de fichier à utiliser pour les paramètres du pilote NVIDIA
nvidia_driver_module_params "" Paramètres à passer au pilote NVIDIA

Variables spécifiques à Red Hat

Variable Valeur par défaut Description
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Paquet à installer pour activer EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" URL de base à utiliser pour le dépôt CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" Clé GPG pour le dépôt CUDA

Variables spécifiques à Ubuntu

Pour les installations sur Ubuntu, vous avez le choix entre utiliser les dépôts Canonical et les dépôts NVIDIA CUDA.

Par défaut, les dépôts Canonical seront utilisés, et le pilote installé sera le pilote pour serveur sans interface graphique.

Variable Valeur par défaut Description
nvidia_driver_ubuntu_install_from_cuda_repo no Indicateur pour utiliser le dépôt CUDA
nvidia_driver_ubuntu_branch 450 Branche du pilote à utiliser pour l'installation
nvidia_driver_ubuntu_packages ["nvidia-headless-450-server", "nvidia-headless-450-utils"] Noms des paquets à installer à partir du dépôt Canonical
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" URL de base à utiliser pour le dépôt CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_url "https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" Clé GPG pour le dépôt CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_id "7fa2af80" ID de la clé GPG pour le dépôt CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Nom du paquet à installer à partir du dépôt CUDA

Exemple de playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Distributions supportées

Actuellement, ce rôle prend en charge les distributions Linux suivantes :

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • CentOS 8
  • Red Hat Enterprise Linux 7
À propos du projet

Install the NVIDIA driver

Installer
ansible-galaxy install grycap.nvidia_driver
Licence
bsd-3-clause
Téléchargements
2.1k
Propriétaire
Grid y Computación de Altas Prestaciones