grycap.nvidia_driver
ansible-role-nvidia-driver
Un rol de Ansible para instalar el controlador NVIDIA desde los repositorios de NVIDIA CUDA.
Requisitos
Durante la instalación del controlador NVIDIA, este rol reiniciará los nodos donde se ejecute. Por esta razón, recomendamos encarecidamente que ejecutes ansible-playbook
desde un nodo diferente al de los nodos GPU donde estás instalando el controlador.
Si intentas ejecutar Ansible en el mismo nodo donde estás instalando el controlador, este rol puede:
- Negarse a continuar con un error como
Running reboot with local connection would reboot the control node
(si se ejecuta con la conexiónlocal
) - Reiniciar el nodo en el que estás ejecutando, ¡interrumpiendo la ejecución del playbook! (si se ejecuta con conexión
ssh
contra localhost)
Instalación
Este rol se puede instalar usando Ansible Galaxy:
$ ansible-galaxy install grycap.nvidia_driver
Variables del rol
Variable | Valor predeterminado | Descripción |
---|---|---|
nvidia_driver_package_version |
"" |
Versión del paquete a instalar. Ten en cuenta que debe coincidir con la versión real del paquete deb o RPM a instalar. |
nvidia_driver_persistence_mode_on |
yes |
Si habilitar o no el modo de persistencia (booleano) |
nvidia_driver_skip_reboot |
no |
Si saltar o no el reinicio del nodo durante la instalación |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Nombre de archivo para usar con los parámetros del controlador NVIDIA |
nvidia_driver_module_params |
"" |
Parámetros a pasar al controlador NVIDIA |
Variables específicas de Red Hat
Variable | Valor predeterminado | Descripción |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Paquete para instalar y habilitar EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
URL base para usar con el repositorio CUDA |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
Clave GPG para el repositorio CUDA |
Variables específicas de Ubuntu
Para instalaciones en Ubuntu, puedes elegir entre instalar desde los repositorios de Canonical o de NVIDIA CUDA.
Por defecto, se usarán los repositorios de Canonical, y el controlador instalado será el controlador para servidor sin cabeza.
Variable | Valor predeterminado | Descripción |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
Bandera para usar el repositorio CUDA |
nvidia_driver_ubuntu_branch |
450 |
Rama del controlador a usar para la instalación |
nvidia_driver_ubuntu_packages |
["nvidia-headless-450-server", "nvidia-headless-450-utils"] |
Nombres de paquetes a instalar desde el repositorio de Canonical |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
URL base para usar con el repositorio CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_url |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" |
Clave GPG para el repositorio CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_id |
"7fa2af80" |
ID de la clave GPG para el repositorio CUDA |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Nombre del paquete a instalar desde el repositorio CUDA |
Ejemplo de playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Distribuciones soportadas
Actualmente, este rol soporta las siguientes distribuciones de Linux:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- CentOS 8
- Red Hat Enterprise Linux 7
ansible-galaxy install grycap.nvidia_driver