nvidia.nvidia_driver
ansible-role-nvidia-driver
Un rôle Ansible pour installer le pilote NVIDIA à partir des dépôts NVIDIA CUDA.
Exigences
Lors de l'installation du pilote NVIDIA, ce rôle redémarrera les nœuds sur lesquels il s'exécute.
Pour cette raison, nous recommandons vivement d'exécuter ansible-playbook
depuis un nœud distinct de celui des GPU sur lequel vous installez le pilote.
Si vous essayez d'exécuter Ansible sur le même nœud où vous installez le pilote, ce rôle :
- Refusera de continuer avec une erreur comme
Running reboot with local connection would reboot the control node
(si exécuté avec la connexionlocal
) - Redémarrera le nœud sur lequel vous exécutez, interrompant l'exécution du playbook ! (si exécuté via une connexion
ssh
contre localhost)
Installation
Ce rôle peut être installé en utilisant Ansible Galaxy:
$ ansible-galaxy install nvidia.nvidia_driver
Variables du rôle
Variable | Valeur par défaut | Description |
---|---|---|
nvidia_driver_package_state |
"present" |
État du paquet pour les paquets de pilote NVIDIA |
nvidia_driver_package_version |
"" |
Version du paquet à installer. Notez que cela doit correspondre à la version réelle du paquet deb ou RPM à installer. |
nvidia_driver_persistence_mode_on |
yes |
Indique si le mode de persistance doit être activé (boolean) |
nvidia_driver_skip_reboot |
no |
Indique s'il faut ignorer le redémarrage du nœud pendant l'installation |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Nom de fichier à utiliser pour les paramètres du pilote NVIDIA |
nvidia_driver_module_params |
"" |
Paramètres à passer au pilote NVIDIA |
nvidia_driver_branch |
"515" |
Branche de pilote par défaut à installer |
Variables spécifiques à Red Hat
Variable | Valeur par défaut | Description |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Paquet à installer pour activer EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
URL de base à utiliser pour le dépôt CUDA |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
Clé GPG pour le dépôt CUDA |
Variables spécifiques à Ubuntu
Pour les installations Ubuntu, vous avez le choix entre installer à partir des dépôts Canonical ou des dépôts NVIDIA CUDA.
Par défaut, les dépôts Canonical seront utilisés, et le pilote installé sera le pilote pour serveur sans interface graphique.
Variable | Valeur par défaut | Description |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
Indique s'il faut utiliser le dépôt CUDA |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
URL de base à utiliser pour le dépôt CUDA |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Nom du paquet à installer depuis le dépôt CUDA |
nvidia_driver_ubuntu_packages_suffix |
"-server" |
Le suffixe ajouté aux paquets apt lors de l'installation |
Exemple de playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Distributions prises en charge
Actuellement, ce rôle prend en charge les distributions Linux suivantes :
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- Red Hat Enterprise Linux 7
- CentOS 8
- Red Hat Enterprise Linux 8
ansible-galaxy install nvidia.nvidia_driver