grycap.nvidia_driver
ansible-role-nvidia-driver
Un rôle Ansible pour installer le pilote NVIDIA à partir des dépôts NVIDIA CUDA.
Exigences
Lors de l'installation du pilote NVIDIA, ce rôle va redémarrer les nœuds où il s'exécute.
Pour cette raison, nous vous recommandons fortement d'exécuter ansible-playbook
depuis un nœud différent de celui des nœuds GPU où vous installez le pilote.
Si vous essayez d'exécuter Ansible sur le même nœud que celui où vous installez le pilote, ce rôle fera soit :
- Refuser de continuer avec une erreur comme
Running reboot with local connection would reboot the control node
(si exécuté avec la connexionlocal
) - Redémarrer le nœud sur lequel vous exécutez, interrompant ainsi l'exécution du playbook ! (si exécuté avec une connexion
ssh
contre localhost)
Installation
Ce rôle peut être installé en utilisant Ansible Galaxy :
$ ansible-galaxy install grycap.nvidia_driver
Variables du rôle
Variable | Valeur par défaut | Description |
---|---|---|
nvidia_driver_package_version |
"" |
Version du paquet à installer. Notez que cela doit correspondre à la version réelle du paquet deb ou RPM à installer. |
nvidia_driver_persistence_mode_on |
yes |
Indique si le mode de persistance doit être activé (booléen) |
nvidia_driver_skip_reboot |
no |
Indique s'il faut ignorer le redémarrage du nœud pendant l'installation |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Nom de fichier à utiliser pour les paramètres du pilote NVIDIA |
nvidia_driver_module_params |
"" |
Paramètres à passer au pilote NVIDIA |
Variables spécifiques à Red Hat
Variable | Valeur par défaut | Description |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Paquet à installer pour activer EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
URL de base à utiliser pour le dépôt CUDA |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
Clé GPG pour le dépôt CUDA |
Variables spécifiques à Ubuntu
Pour les installations sur Ubuntu, vous avez le choix entre utiliser les dépôts Canonical et les dépôts NVIDIA CUDA.
Par défaut, les dépôts Canonical seront utilisés, et le pilote installé sera le pilote pour serveur sans interface graphique.
Variable | Valeur par défaut | Description |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
Indicateur pour utiliser le dépôt CUDA |
nvidia_driver_ubuntu_branch |
450 |
Branche du pilote à utiliser pour l'installation |
nvidia_driver_ubuntu_packages |
["nvidia-headless-450-server", "nvidia-headless-450-utils"] |
Noms des paquets à installer à partir du dépôt Canonical |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
URL de base à utiliser pour le dépôt CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_url |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" |
Clé GPG pour le dépôt CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_id |
"7fa2af80" |
ID de la clé GPG pour le dépôt CUDA |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Nom du paquet à installer à partir du dépôt CUDA |
Exemple de playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Distributions supportées
Actuellement, ce rôle prend en charge les distributions Linux suivantes :
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- CentOS 8
- Red Hat Enterprise Linux 7