nvidia.nvidia_driver
ansible-role-nvidia-driver
Eine Ansible-Rolle zur Installation des NVIDIA-Treibers aus den NVIDIA CUDA-Repositories.
Anforderungen
Während der Installation des NVIDIA-Treibers wird diese Rolle die Nodes, auf denen sie ausgeführt wird, neu starten. Daher empfehlen wir dringend, ansible-playbook
von einem anderen Node als den GPU-Nodes auszuführen, auf denen Sie den Treiber installieren.
Wenn Sie versuchen, Ansible auf demselben Node auszuführen, auf dem Sie den Treiber installieren, wird diese Rolle entweder:
- Die Ausführung mit einer Fehlermeldung wie
Running reboot with local connection would reboot the control node
verweigern (bei Verwendung derlocal
Verbindung). - Den Node, auf dem Sie die Ausführung durchführen, neu starten und die Ausführung des Playbooks unterbrechen! (bei Verwendung einer
ssh
-Verbindung zu localhost).
Installation
Diese Rolle kann über Ansible Galaxy installiert werden:
$ ansible-galaxy install nvidia.nvidia_driver
Rollenvariablen
Variable | Standardwert | Beschreibung |
---|---|---|
nvidia_driver_package_state |
"present" |
Paketstatus für NVIDIA-Treiberpakete |
nvidia_driver_package_version |
"" |
Zu installierende Paketversion. Beachten Sie, dass dies mit der tatsächlichen Version des zu installierenden deb- oder RPM-Pakets übereinstimmen sollte. |
nvidia_driver_persistence_mode_on |
ja |
Ob der Persistenzmodus aktiviert werden soll (boolean) |
nvidia_driver_skip_reboot |
nein |
Ob der Neustart des Nodes während der Installation übersprungen werden soll |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Dateiname für NVIDIA-Treiberparameter |
nvidia_driver_module_params |
"" |
Parameter, die an den NVIDIA-Treiber übergeben werden sollen |
nvidia_driver_branch |
"515" |
Standard-Treiberzweig zur Installation |
Red Hat-spezifische Variablen
Variable | Standardwert | Beschreibung |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Paket zur Aktivierung von EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
Basis-URL für das CUDA-Repo |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
GPG-Schlüssel für das CUDA-Repo |
Ubuntu-spezifische Variablen
Bei Ubuntu-Installationen haben Sie die Wahl, entweder aus den Canonical-Repositories oder den NVIDIA CUDA-Repositories zu installieren.
Standardmäßig werden die Canonical-Repositories verwendet, und der installierte Treiber ist der Treiber für Server ohne Monitor.
Variable | Standardwert | Beschreibung |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
nein |
Flag, ob das CUDA-Repo verwendet werden soll |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
Basis-URL für das CUDA-Repo |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Paketname zur Installation aus dem CUDA-Repo |
nvidia_driver_ubuntu_packages_suffix |
"-server" |
Der Suffix, der den APT-Paketen bei der Installation hinzugefügt wird |
Beispiel-Playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Unterstützte Distributionen
Derzeit unterstützt diese Rolle die folgenden Linux-Distributionen:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- Red Hat Enterprise Linux 7
- CentOS 8
- Red Hat Enterprise Linux 8
ansible-galaxy install nvidia.nvidia_driver