nvidia.nvidia_driver

ansible-role-nvidia-driver

Rola Ansible do instalacji sterownika NVIDIA z repozytoriów NVIDIA CUDA.

Wymagania

Podczas instalacji sterownika NVIDIA, ta rola spowoduje ponowne uruchomienie węzłów, na których jest uruchamiana. Z tego powodu zdecydowanie zalecamy uruchamianie ansible-playbook z oddzielnego węzła niż węzły GPU, na których instalujesz sterownik.

Jeśli spróbujesz uruchomić Ansible na tym samym węźle, na którym instalujesz sterownik, ta rola:

  • Odrzuci kontynuację z błędem, takim jak Running reboot with local connection would reboot the control node (jeśli działa w połączeniu local)
  • Zrestartuje węzeł, na którym działasz, przerywając wykonanie playbooka! (jeśli działa w połączeniu ssh na localhost)

Instalacja

Ta rola może być zainstalowana przy użyciu Ansible Galaxy:

$ ansible-galaxy install nvidia.nvidia_driver

Zmienne roli

Zmienna Wartość domyślna Opis
nvidia_driver_package_state "present" Stan pakietu dla pakietów sterownika NVIDIA
nvidia_driver_package_version "" Wersja pakietu do zainstalowania. Należy pamiętać, że powinna odpowiadać rzeczywistej wersji pakietu deb lub RPM.
nvidia_driver_persistence_mode_on yes Czy włączyć tryb długotrwały (boolean)
nvidia_driver_skip_reboot no Czy pominąć ponowne uruchomienie węzła podczas instalacji
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Nazwa pliku do użycia dla parametrów sterownika NVIDIA
nvidia_driver_module_params "" Parametry do przekazania do sterownika NVIDIA
nvidia_driver_branch "515" Domyślna gałąź sterownika do zainstalowania

Zmienne specyficzne dla Red Hat

Zmienna Wartość domyślna Opis
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Pakiet do zainstalowania w celu włączenia EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" Podstawowy URL do repo CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" Klucz GPG do repo CUDA

Zmienne specyficzne dla Ubuntu

Dla instalacji Ubuntu możesz wybierać między instalacją z repozytoriów Canonical a repozytoriami NVIDIA CUDA.

Domyślnie używane będą repozytoria Canonical, a zainstalowany sterownik to sterownik dla serwera bez GUI.

Zmienna Wartość domyślna Opis
nvidia_driver_ubuntu_install_from_cuda_repo no Flaga, czy używać repo CUDA
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" Podstawowy URL do repo CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Nazwa pakietu do zainstalowania z repo CUDA
nvidia_driver_ubuntu_packages_suffix "-server" Przyrostek dodawany do pakietów apt podczas instalacji

Przykładowy playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Obsługiwane dystrybucje

Obecnie ta rola obsługuje następujące dystrybucje Linuksa:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • Red Hat Enterprise Linux 7
  • CentOS 8
  • Red Hat Enterprise Linux 8
O projekcie

Install the NVIDIA driver

Zainstaluj
ansible-galaxy install nvidia.nvidia_driver
Licencja
bsd-3-clause
Pobrania
329.2k
Właściciel