grycap.nvidia_driver
ansible-role-nvidia-driver
NVIDIA CUDAリポジトリからNVIDIAドライバーをインストールするためのAnsibleロールです。
要件
NVIDIAドライバーをインストールする際、このロールは実行されたノードを再起動します。
そのため、ドライバーをインストールするGPUノードとは別のノードからansible-playbook
を実行することを強くお勧めします。
ドライバーをインストールしているノードでAnsibleを実行しようとすると、このロールは以下のようになります:
local
接続で実行している場合、Running reboot with local connection would reboot the control node
というエラーで続行を拒否します。localhost
に対してssh
接続で実行している場合、実行中のノードを再起動し、プレイブックの実行を中断します!
インストール
このロールはAnsible Galaxyを使用してインストールできます:
$ ansible-galaxy install grycap.nvidia_driver
ロール変数
変数 | デフォルト値 | 説明 |
---|---|---|
nvidia_driver_package_version |
"" |
インストールするパッケージのバージョン。実際のdebまたはRPMパッケージのバージョンと一致する必要があります。 |
nvidia_driver_persistence_mode_on |
yes |
永続モードを有効にするかどうか(ブール値) |
nvidia_driver_skip_reboot |
no |
インストール中にノードの再起動をスキップするかどうか |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
NVIDIAドライバーのパラメータに使用するファイル名 |
nvidia_driver_module_params |
"" |
NVIDIAドライバーに渡すパラメータ |
Red Hat特有の変数
変数 | デフォルト値 | 説明 |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
EPELを有効にするためにインストールするパッケージ |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
CUDAリポジトリに使用するベースURL |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
CUDAリポジトリのGPGキー |
Ubuntu特有の変数
Ubuntuをインストールする場合、CanonicalリポジトリとNVIDIA CUDAリポジトリのどちらからインストールするか選択できます。
デフォルトではCanonicalリポジトリが使用され、インストールされるドライバーはヘッドレスサーバードライバーです。
変数 | デフォルト値 | 説明 |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
CUDAリポジトリを使用するかどうかのフラグ |
nvidia_driver_ubuntu_branch |
450 |
インストールに使用するドライバーブランチ |
nvidia_driver_ubuntu_packages |
["nvidia-headless-450-server", "nvidia-headless-450-utils"] |
Canonicalリポジトリからインストールするパッケージ名 |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
CUDAリポジトリに使用するベースURL |
nvidia_driver_ubuntu_cuda_repo_gpgkey_url |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" |
CUDAリポジトリのGPGキー |
nvidia_driver_ubuntu_cuda_repo_gpgkey_id |
"7fa2af80" |
CUDAリポジトリのGPGキーID |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
CUDAリポジトリからインストールするパッケージ名 |
例プレイブック
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
対応するディストリビューション
現在、このロールは以下のLinuxディストリビューションをサポートしています:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- CentOS 8
- Red Hat Enterprise Linux 7