nvidia.nvidia_driver
ansible-role-nvidia-driver
Un papel de Ansible para instalar el controlador NVIDIA desde los repositorios de NVIDIA CUDA.
Requisitos
Durante el proceso de instalación del controlador NVIDIA, este papel reiniciará los nodos donde se ejecute. Por esta razón, se recomienda encarecidamente que ejecutes ansible-playbook
desde un nodo separado de los nodos GPU donde estás instalando el controlador.
Si intentas ejecutar Ansible en el mismo nodo donde estás instalando el controlador, este papel:
- Se negará a continuar con un error como
Running reboot with local connection would reboot the control node
(si se ejecuta con la conexiónlocal
) - Reiniciará el nodo donde estás ejecutando, ¡interrumpiendo la ejecución del playbook! (si se está utilizando una conexión
ssh
en localhost)
Instalación
Este papel se puede instalar usando Ansible Galaxy:
$ ansible-galaxy install nvidia.nvidia_driver
Variables del papel
Variable | Valor por defecto | Descripción |
---|---|---|
nvidia_driver_package_state |
"present" |
Estado del paquete para los paquetes del controlador NVIDIA |
nvidia_driver_package_version |
"" |
Versión del paquete a instalar. Ten en cuenta que esta debe coincidir con la versión real del paquete deb o RPM que se va a instalar. |
nvidia_driver_persistence_mode_on |
yes |
Si se debe habilitar el modo de persistencia (booleano) |
nvidia_driver_skip_reboot |
no |
Si se debe omitir el reinicio del nodo durante la instalación |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Nombre del archivo para usar con los parámetros del controlador NVIDIA |
nvidia_driver_module_params |
"" |
Parámetros que se pasarán al controlador NVIDIA |
nvidia_driver_branch |
"515" |
Rama de controlador predeterminada para instalar |
Variables específicas de Red Hat
Variable | Valor por defecto | Descripción |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Paquete a instalar para habilitar EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
URL base para usar en el repositorio CUDA |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
Clave GPG para el repositorio CUDA |
Variables específicas de Ubuntu
Para instalaciones en Ubuntu, puedes elegir instalar desde los repositorios de Canonical o desde los repositorios de NVIDIA CUDA.
Por defecto, se utilizarán los repositorios de Canonical y el controlador instalado será el controlador para servidores sin cabeza.
Variable | Valor por defecto | Descripción |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
Indicador de si se debe usar el repositorio CUDA |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
URL base para usar en el repositorio CUDA |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Nombre del paquete a instalar desde el repositorio CUDA |
nvidia_driver_ubuntu_packages_suffix |
"-server" |
Sufijo añadido a los paquetes apt al instalar |
Ejemplo de playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Distribuciones soportadas
Actualmente, este papel es compatible con las siguientes distribuciones de Linux:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- Red Hat Enterprise Linux 7
- CentOS 8
- Red Hat Enterprise Linux 8
ansible-galaxy install nvidia.nvidia_driver