nvidia_driver

ansible-role-nvidia-driver

Ansible роль для установки драйвера NVIDIA из репозиториев NVIDIA CUDA.

Требования

В процессе установки драйвера NVIDIA эта роль перезагрузит узлы, на которых она выполняется. Поэтому мы настоятельно рекомендуем запускать ansible-playbook с отдельного узла, отличного от узлов GPU, на которых вы устанавливаете драйвер.

Если вы попытаетесь запустить Ansible на том же узле, где вы устанавливаете драйвер, эта роль либо:

  • Откажется продолжать с ошибкой, типа Running reboot with local connection would reboot the control node (если запущена с local соединением)
  • Перезагрузит узел, на котором вы работаете, прервав выполнение плейбука! (если запущена по соединению ssh с localhost)

Установка

Эту роль можно установить с помощью Ansible Galaxy:

$ ansible-galaxy install grycap.nvidia_driver

Переменные роли

Переменная Значение по умолчанию Описание
nvidia_driver_package_version "" Версия пакета для установки. Обратите внимание, что это должно совпадать с фактической версией deb или RPM пакета, который будет установлен.
nvidia_driver_persistence_mode_on yes Включить режим постоянства (логическое значение)
nvidia_driver_skip_reboot no Пропустить перезагрузку узла во время установки
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" Имя файла для параметров драйвера NVIDIA
nvidia_driver_module_params "" Параметры для передачи драйверу NVIDIA

Переменные, специфичные для Red Hat

Переменная Значение по умолчанию Описание
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" Пакет для установки для включения EPEL
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" Базовый URL для CUDA репозитория
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" GPG ключ для CUDA репозитория

Переменные, специфичные для Ubuntu

Для установки на Ubuntu вы можете выбрать установку из репозиториев Canonical или из репозиториев NVIDIA CUDA.

По умолчанию будут использоваться репозитории Canonical, и установлен будет драйвер для безголового сервера.

Переменная Значение по умолчанию Описание
nvidia_driver_ubuntu_install_from_cuda_repo no Флаг для использования CUDA репозитория
nvidia_driver_ubuntu_branch 450 Ветвь драйвера для установки
nvidia_driver_ubuntu_packages ["nvidia-headless-450-server", "nvidia-headless-450-utils"] Названия пакетов для установки из репозитория Canonical
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" Базовый URL для CUDA репозитория
nvidia_driver_ubuntu_cuda_repo_gpgkey_url "https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" GPG ключ для CUDA репозитория
nvidia_driver_ubuntu_cuda_repo_gpgkey_id "7fa2af80" ID GPG ключа для CUDA репозитория
nvidia_driver_ubuntu_cuda_package "cuda-drivers" Название пакета для установки из CUDA репозитория

Пример плейбука

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

Поддерживаемые дистрибутивы

В настоящее время эта роль поддерживает следующие дистрибутивы Linux:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • CentOS 8
  • Red Hat Enterprise Linux 7
О проекте

Install the NVIDIA driver

Установить
ansible-galaxy install grycap/ansible-role-nvidia-driver
Лицензия
bsd-3-clause
Загрузки
2056
Владелец
Grid y Computación de Altas Prestaciones