nvidia.nvidia_driver

ansible-role-nvidia-driver

Eine Ansible-Rolle zur Installation des NVIDIA-Treibers aus den NVIDIA CUDA-Repositories.

Anforderungen

Während der Installation des NVIDIA-Treibers wird diese Rolle die Nodes, auf denen sie ausgeführt wird, neu starten. Daher empfehlen wir dringend, ansible-playbook von einem anderen Node als den GPU-Nodes auszuführen, auf denen Sie den Treiber installieren.

Wenn Sie versuchen, Ansible auf demselben Node auszuführen, auf dem Sie den Treiber installieren, wird diese Rolle entweder:

  • Die Ausführung mit einer Fehlermeldung wie Running reboot with local connection would reboot the control node verweigern (bei Verwendung der local Verbindung).
  • Den Node, auf dem Sie die Ausführung durchführen, neu starten und die Ausführung des Playbooks unterbrechen! (bei Verwendung einer ssh-Verbindung zu localhost).

Installation

Diese Rolle kann über Ansible Galaxy installiert werden:

$ ansible-galaxy install nvidia.nvidia_driver

Rollenvariablen

Variable Standardwert Beschreibung
nvidia_driver_package_state "present" Paketstatus für NVIDIA-Treiberpakete
nvidia_driver_package_version "" Zu installierende Paketversion. Beachten Sie, dass dies mit der tatsächlichen Version des zu installierenden deb- oder RPM-Pakets übereinstimmen sollte.
nvidia_driver_persistence_mode_on ja Ob der Persistenzmodus aktiviert werden soll (boolean)
nvidia_driver_skip_reboot nein Ob der Neustart des Nodes während der Installation übersprungen werden soll
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Dateiname für NVIDIA-Treiberparameter
nvidia_driver_module_params "" Parameter, die an den NVIDIA-Treiber übergeben werden sollen
nvidia_driver_branch "515" Standard-Treiberzweig zur Installation

Red Hat-spezifische Variablen

Variable Standardwert Beschreibung
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Paket zur Aktivierung von EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" Basis-URL für das CUDA-Repo
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" GPG-Schlüssel für das CUDA-Repo

Ubuntu-spezifische Variablen

Bei Ubuntu-Installationen haben Sie die Wahl, entweder aus den Canonical-Repositories oder den NVIDIA CUDA-Repositories zu installieren.

Standardmäßig werden die Canonical-Repositories verwendet, und der installierte Treiber ist der Treiber für Server ohne Monitor.

Variable Standardwert Beschreibung
nvidia_driver_ubuntu_install_from_cuda_repo nein Flag, ob das CUDA-Repo verwendet werden soll
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" Basis-URL für das CUDA-Repo
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Paketname zur Installation aus dem CUDA-Repo
nvidia_driver_ubuntu_packages_suffix "-server" Der Suffix, der den APT-Paketen bei der Installation hinzugefügt wird

Beispiel-Playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Unterstützte Distributionen

Derzeit unterstützt diese Rolle die folgenden Linux-Distributionen:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • Red Hat Enterprise Linux 7
  • CentOS 8
  • Red Hat Enterprise Linux 8
Über das Projekt

Install the NVIDIA driver

Installieren
ansible-galaxy install nvidia.nvidia_driver
Lizenz
bsd-3-clause
Downloads
329.2k