grycap.nvidia_driver

ansible-role-nvidia-driver

Un rol de Ansible para instalar el controlador NVIDIA desde los repositorios de NVIDIA CUDA.

Requisitos

Durante la instalación del controlador NVIDIA, este rol reiniciará los nodos donde se ejecute. Por esta razón, recomendamos encarecidamente que ejecutes ansible-playbook desde un nodo diferente al de los nodos GPU donde estás instalando el controlador.

Si intentas ejecutar Ansible en el mismo nodo donde estás instalando el controlador, este rol puede:

  • Negarse a continuar con un error como Running reboot with local connection would reboot the control node (si se ejecuta con la conexión local)
  • Reiniciar el nodo en el que estás ejecutando, ¡interrumpiendo la ejecución del playbook! (si se ejecuta con conexión ssh contra localhost)

Instalación

Este rol se puede instalar usando Ansible Galaxy:

$ ansible-galaxy install grycap.nvidia_driver

Variables del rol

Variable Valor predeterminado Descripción
nvidia_driver_package_version "" Versión del paquete a instalar. Ten en cuenta que debe coincidir con la versión real del paquete deb o RPM a instalar.
nvidia_driver_persistence_mode_on yes Si habilitar o no el modo de persistencia (booleano)
nvidia_driver_skip_reboot no Si saltar o no el reinicio del nodo durante la instalación
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Nombre de archivo para usar con los parámetros del controlador NVIDIA
nvidia_driver_module_params "" Parámetros a pasar al controlador NVIDIA

Variables específicas de Red Hat

Variable Valor predeterminado Descripción
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Paquete para instalar y habilitar EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" URL base para usar con el repositorio CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" Clave GPG para el repositorio CUDA

Variables específicas de Ubuntu

Para instalaciones en Ubuntu, puedes elegir entre instalar desde los repositorios de Canonical o de NVIDIA CUDA.

Por defecto, se usarán los repositorios de Canonical, y el controlador instalado será el controlador para servidor sin cabeza.

Variable Valor predeterminado Descripción
nvidia_driver_ubuntu_install_from_cuda_repo no Bandera para usar el repositorio CUDA
nvidia_driver_ubuntu_branch 450 Rama del controlador a usar para la instalación
nvidia_driver_ubuntu_packages ["nvidia-headless-450-server", "nvidia-headless-450-utils"] Nombres de paquetes a instalar desde el repositorio de Canonical
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" URL base para usar con el repositorio CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_url "https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" Clave GPG para el repositorio CUDA
nvidia_driver_ubuntu_cuda_repo_gpgkey_id "7fa2af80" ID de la clave GPG para el repositorio CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Nombre del paquete a instalar desde el repositorio CUDA

Ejemplo de playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Distribuciones soportadas

Actualmente, este rol soporta las siguientes distribuciones de Linux:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • CentOS 8
  • Red Hat Enterprise Linux 7
Acerca del proyecto

Install the NVIDIA driver

Instalar
ansible-galaxy install grycap.nvidia_driver
Licencia
bsd-3-clause
Descargas
2.1k
Propietario
Grid y Computación de Altas Prestaciones