grycap.nvidia_driver

ansible-role-nvidia-driver

NVIDIA CUDAリポジトリからNVIDIAドライバーをインストールするためのAnsibleロールです。

要件

NVIDIAドライバーをインストールする際、このロールは実行されたノードを再起動します。 そのため、ドライバーをインストールするGPUノードとは別のノードからansible-playbookを実行することを強くお勧めします。

ドライバーをインストールしているノードでAnsibleを実行しようとすると、このロールは以下のようになります:

  • local接続で実行している場合、Running reboot with local connection would reboot the control nodeというエラーで続行を拒否します。
  • localhostに対してssh接続で実行している場合、実行中のノードを再起動し、プレイブックの実行を中断します!

インストール

このロールはAnsible Galaxyを使用してインストールできます:

$ ansible-galaxy install grycap.nvidia_driver

ロール変数

変数 デフォルト値 説明
nvidia_driver_package_version "" インストールするパッケージのバージョン。実際のdebまたはRPMパッケージのバージョンと一致する必要があります。
nvidia_driver_persistence_mode_on yes 永続モードを有効にするかどうか(ブール値)
nvidia_driver_skip_reboot no インストール中にノードの再起動をスキップするかどうか
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" NVIDIAドライバーのパラメータに使用するファイル名
nvidia_driver_module_params "" NVIDIAドライバーに渡すパラメータ

Red Hat特有の変数

変数 デフォルト値 説明
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" EPELを有効にするためにインストールするパッケージ
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" CUDAリポジトリに使用するベースURL
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" CUDAリポジトリのGPGキー

Ubuntu特有の変数

Ubuntuをインストールする場合、CanonicalリポジトリとNVIDIA CUDAリポジトリのどちらからインストールするか選択できます。

デフォルトではCanonicalリポジトリが使用され、インストールされるドライバーはヘッドレスサーバードライバーです。

変数 デフォルト値 説明
nvidia_driver_ubuntu_install_from_cuda_repo no CUDAリポジトリを使用するかどうかのフラグ
nvidia_driver_ubuntu_branch 450 インストールに使用するドライバーブランチ
nvidia_driver_ubuntu_packages ["nvidia-headless-450-server", "nvidia-headless-450-utils"] Canonicalリポジトリからインストールするパッケージ名
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" CUDAリポジトリに使用するベースURL
nvidia_driver_ubuntu_cuda_repo_gpgkey_url "https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" CUDAリポジトリのGPGキー
nvidia_driver_ubuntu_cuda_repo_gpgkey_id "7fa2af80" CUDAリポジトリのGPGキーID
nvidia_driver_ubuntu_cuda_package "cuda-drivers" CUDAリポジトリからインストールするパッケージ名

例プレイブック

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

対応するディストリビューション

現在、このロールは以下のLinuxディストリビューションをサポートしています:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • CentOS 8
  • Red Hat Enterprise Linux 7
プロジェクトについて

Install the NVIDIA driver

インストール
ansible-galaxy install grycap.nvidia_driver
ライセンス
bsd-3-clause
ダウンロード
2.1k
所有者
Grid y Computación de Altas Prestaciones