nvidia_driver

ansible-role-nvidia-driver

Ansible-роль для установки драйвера NVIDIA из репозиториев NVIDIA CUDA.

Требования

В процессе установки драйвера NVIDIA эта роль будет перезагружать узлы, на которых она выполняется. Поэтому мы настоятельно рекомендуем запускать ansible-playbook с отдельного узла, отличного от узлов с GPU, на которых вы устанавливаете драйвер.

Если вы попытаетесь запустить Ansible на том же узле, где устанавливаете драйвер, эта роль либо:

  • Откажется продолжать с ошибкой, такой как Запуск перезагрузки с локальным подключением перезагрузит управляющий узел (если выполняется с local подключением)
  • Перезагрузит узел, на котором вы выполняете, прервёт выполнение плейбука! (если выполняется с ssh подключением к localhost)

Установка

Эту роль можно установить с помощью Ansible Galaxy:

$ ansible-galaxy install nvidia.nvidia_driver

Переменные роли

Переменная Значение по умолчанию Описание
nvidia_driver_package_state "present" Состояние пакета для пакетов драйвера NVIDIA
nvidia_driver_package_version "" Версия пакета для установки. Обратите внимание, что это должно соответствовать фактической версии пакета deb или RPM.
nvidia_driver_persistence_mode_on yes Включить ли режим постоянства (логическое значение)
nvidia_driver_skip_reboot no Пропустить ли перезагрузку узла во время установки
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Имя файла для параметров драйвера NVIDIA
nvidia_driver_module_params "" Параметры для передачи драйверу NVIDIA
nvidia_driver_branch "515" Модуль ветви драйвера для установки

Переменные для Red Hat

Переменная Значение по умолчанию Описание
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Пакет для установки поддержки EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" Базовый URL для репозитория CUDA
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" GPG-ключ для репозитория CUDA

Переменные для Ubuntu

Для установок Ubuntu вы можете выбрать установку из репозиториев Canonical и репозиториев NVIDIA CUDA.

По умолчанию будут использоваться репозитории Canonical, и устанавливаемый драйвер будет для безголового сервера.

Переменная Значение по умолчанию Описание
nvidia_driver_ubuntu_install_from_cuda_repo no Флаг для использования репозитория CUDA
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" Базовый URL для репозитория CUDA
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Название пакета для установки из репозитория CUDA
nvidia_driver_ubuntu_packages_suffix "-server" Суффикс, добавляемый к пакету при установке

Пример плейбука

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Поддерживаемые дистрибутивы

В настоящее время эта роль поддерживает следующие дистрибутивы Linux:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • Red Hat Enterprise Linux 7
  • CentOS 8
  • Red Hat Enterprise Linux 8
О проекте

Install the NVIDIA driver

Установить
ansible-galaxy install NVIDIA/ansible-role-nvidia-driver
Лицензия
bsd-3-clause
Загрузки
264108
Владелец