grycap.nvidia_driver

rola-ansible-nvidia-driver

Rola Ansible do instalacji sterownika NVIDIA z repozytoriów NVIDIA CUDA.

Wymagania

Podczas instalacji sterownika NVIDIA, ta rola zresetuje węzły, na których jest uruchamiana. Z tego powodu zdecydowanie zalecamy, aby uruchomić ansible-playbook z innego węzła niż węzły GPU, na których instalujesz sterownik.

Jeśli spróbujesz uruchomić Ansible na tym samym węźle, gdzie instalujesz sterownik, ta rola:

  • Odrzuci dalsze działanie z błędem: Running reboot with local connection would reboot the control node (jeśli działa z użyciem połączenia local)
  • Zresetuje węzeł, na którym działa, przerywając wykonywanie playbooka! (jeśli działa z połączeniem ssh z localhost)

Instalacja

Tę rolę można zainstalować za pomocą Ansible Galaxy:

$ ansible-galaxy install grycap.nvidia_driver

Zmienne roli

Zmienna Wartość domyślna Opis
nvidia_driver_package_version "" Wersja pakietu do zainstalowania. Należy pamiętać, że powinna odpowiadać rzeczywistej wersji pakietu deb lub RPM do zainstalowania.
nvidia_driver_persistence_mode_on yes Czy włączyć tryb trwałości (boolean)
nvidia_driver_skip_reboot no Czy pominąć restart węzła podczas instalacji
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Nazwa pliku do użycia dla parametrów sterownika NVIDIA
nvidia_driver_module_params "" Parametry do przekazania do sterownika NVIDIA

Zmienne specyficzne dla Red Hat

Zmienna Wartość domyślna Opis
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Pakiet do zainstalowania w celu włączenia EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" Podstawowy URL do repo CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" Klucz GPG dla repo CUDA

Zmienne specyficzne dla Ubuntu

Dla instalacji na Ubuntu masz możliwość instalacji z repozytoriów Canonical oraz z repozytoriów NVIDIA CUDA.

Domyślnie będą używane repozytoria Canonical, a zainstalowany sterownik to sterownik serwera bez głowy.

Zmienna Wartość domyślna Opis
nvidia_driver_ubuntu_install_from_cuda_repo no Flaga, czy użyć repo CUDA
nvidia_driver_ubuntu_branch 450 Gałąź sterownika do użycia podczas instalacji
nvidia_driver_ubuntu_packages ["nvidia-headless-450-server", "nvidia-headless-450-utils"] Nazwy pakietów do zainstalowania z repozytorium Canonical
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" Podstawowy URL do repo CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_url "https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" Klucz GPG dla repo CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_id "7fa2af80" ID klucza GPG dla repo CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Nazwa pakietu do zainstalowania z repo CUDA

Przykładowy playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Obsługiwane dystrybucje

Obecnie ta rola obsługuje następujące dystrybucje Linuksa:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • CentOS 8
  • Red Hat Enterprise Linux 7
O projekcie

Install the NVIDIA driver

Zainstaluj
ansible-galaxy install grycap.nvidia_driver
Licencja
bsd-3-clause
Pobrania
2.1k
Właściciel
Grid y Computación de Altas Prestaciones