nvidia.nvidia_driver

ansible-role-nvidia-driver

NVIDIA CUDAリポジトリからNVIDIAドライバーをインストールするためのAnsibleロールです。

要件

NVIDIAドライバーをインストールする際、このロールはノードを再起動します。 そのため、ドライバーをインストールするGPUノードとは別のノードからansible-playbookを実行することを強くお勧めします。

同じノードでAnsibleを実行しようとすると、このロールは以下のいずれかになります:

  • local接続で実行している場合、「ローカル接続での再起動を実行することは制御ノードを再起動することになります」というエラーが表示されて進行を拒否します。
  • ssh接続でローカルホストに対して実行している場合、実行中のノードが再起動し、プレイブックの実行が中断されます!

インストール

このロールはAnsible Galaxyを使ってインストールできます:

$ ansible-galaxy install nvidia.nvidia_driver

ロール変数

変数名 デフォルト値 説明
nvidia_driver_package_state "present" NVIDIAドライバーパッケージの状態
nvidia_driver_package_version "" インストールするパッケージのバージョン。これはインストールするdebまたはRPMパッケージの実際のバージョンと一致する必要があります。
nvidia_driver_persistence_mode_on yes 永続モードを有効にするかどうか(真偽値)
nvidia_driver_skip_reboot no インストール中にノードの再起動をスキップするかどうか
nvidia_driver_module_file "/etc/modprobe.d/nvidia.conf" NVIDIAドライバーのパラメータに使用するファイル名
nvidia_driver_module_params "" NVIDIAドライバーに渡すパラメータ
nvidia_driver_branch "515" インストールするデフォルトドライバーブランチ

Red Hat特有の変数

変数名 デフォルト値 説明
epel_package "https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" EPELを有効にするためのパッケージ
nvidia_driver_rhel_cuda_repo_baseurl "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" CUDAリポジトリのベースURL
nvidia_driver_rhel_cuda_repo_gpgkey "https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" CUDAリポジトリのGPGキー

Ubuntu特有の変数

Ubuntuのインストールでは、CanonicalリポジトリとNVIDIA CUDAリポジトリからのインストールを選択できます。

デフォルトでは、Canonicalリポジトリが使用され、インストールされるドライバーはヘッドレスサーバードライバーです。

変数名 デフォルト値 説明
nvidia_driver_ubuntu_install_from_cuda_repo no CUDAリポジトリを使用するかどうかのフラグ
nvidia_driver_ubuntu_cuda_repo_baseurl "http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" CUDAリポジトリのベースURL
nvidia_driver_ubuntu_cuda_package "cuda-drivers" CUDAリポジトリからインストールするパッケージ名
nvidia_driver_ubuntu_packages_suffix "-server" インストール時にaptパッケージに追加されるサフィックス

例のプレイブック

- hosts: gpu_nodes
  roles:
  - nvidia.nvidia_driver

サポートされているディストリビューション

現在、このロールは以下のLinuxディストリビューションをサポートしています:

  • NVIDIA DGX OS 4
  • NVIDIA DGX OS 5
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS
  • CentOS 7
  • Red Hat Enterprise Linux 7
  • CentOS 8
  • Red Hat Enterprise Linux 8
プロジェクトについて

Install the NVIDIA driver

インストール
ansible-galaxy install nvidia.nvidia_driver
ライセンス
bsd-3-clause
ダウンロード
329.2k