nvidia.nvidia_driver

ansible-role-nvidia-driver

Un papel de Ansible para instalar el controlador NVIDIA desde los repositorios de NVIDIA CUDA.

Requisitos

Durante el proceso de instalación del controlador NVIDIA, este papel reiniciará los nodos donde se ejecute. Por esta razón, se recomienda encarecidamente que ejecutes ansible-playbook desde un nodo separado de los nodos GPU donde estás instalando el controlador.

Si intentas ejecutar Ansible en el mismo nodo donde estás instalando el controlador, este papel:

  • Se negará a continuar con un error como Running reboot with local connection would reboot the control node (si se ejecuta con la conexión local)
  • Reiniciará el nodo donde estás ejecutando, ¡interrumpiendo la ejecución del playbook! (si se está utilizando una conexión ssh en localhost)

Instalación

Este papel se puede instalar usando Ansible Galaxy:

$ ansible-galaxy install nvidia.nvidia_driver

Variables del papel

Variable Valor por defecto Descripción
nvidia_driver_package_state "present" Estado del paquete para los paquetes del controlador NVIDIA
nvidia_driver_package_version "" Versión del paquete a instalar. Ten en cuenta que esta debe coincidir con la versión real del paquete deb o RPM que se va a instalar.
nvidia_driver_persistence_mode_on yes Si se debe habilitar el modo de persistencia (booleano)
nvidia_driver_skip_reboot no Si se debe omitir el reinicio del nodo durante la instalación
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Nombre del archivo para usar con los parámetros del controlador NVIDIA
nvidia_driver_module_params "" Parámetros que se pasarán al controlador NVIDIA
nvidia_driver_branch "515" Rama de controlador predeterminada para instalar

Variables específicas de Red Hat

Variable Valor por defecto Descripción
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Paquete a instalar para habilitar EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" URL base para usar en el repositorio CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" Clave GPG para el repositorio CUDA

Variables específicas de Ubuntu

Para instalaciones en Ubuntu, puedes elegir instalar desde los repositorios de Canonical o desde los repositorios de NVIDIA CUDA.

Por defecto, se utilizarán los repositorios de Canonical y el controlador instalado será el controlador para servidores sin cabeza.

Variable Valor por defecto Descripción
nvidia_driver_ubuntu_install_from_cuda_repo no Indicador de si se debe usar el repositorio CUDA
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" URL base para usar en el repositorio CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Nombre del paquete a instalar desde el repositorio CUDA
nvidia_driver_ubuntu_packages_suffix "-server" Sufijo añadido a los paquetes apt al instalar

Ejemplo de playbook

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Distribuciones soportadas

Actualmente, este papel es compatible con las siguientes distribuciones de Linux:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • Red Hat Enterprise Linux 7
  • CentOS 8
  • Red Hat Enterprise Linux 8
Acerca del proyecto

Install the NVIDIA driver

Instalar
ansible-galaxy install nvidia.nvidia_driver
Licencia
bsd-3-clause
Descargas
329.2k
Propietario