nvidia.nvidia_driver
ansible-role-nvidia-driver
NVIDIA CUDAリポジトリからNVIDIAドライバーをインストールするためのAnsibleロールです。
要件
NVIDIAドライバーをインストールする際、このロールはノードを再起動します。
そのため、ドライバーをインストールするGPUノードとは別のノードからansible-playbook
を実行することを強くお勧めします。
同じノードでAnsibleを実行しようとすると、このロールは以下のいずれかになります:
local
接続で実行している場合、「ローカル接続での再起動を実行することは制御ノードを再起動することになります
」というエラーが表示されて進行を拒否します。ssh
接続でローカルホストに対して実行している場合、実行中のノードが再起動し、プレイブックの実行が中断されます!
インストール
このロールはAnsible Galaxyを使ってインストールできます:
$ ansible-galaxy install nvidia.nvidia_driver
ロール変数
変数名 | デフォルト値 | 説明 |
---|---|---|
nvidia_driver_package_state |
"present" |
NVIDIAドライバーパッケージの状態 |
nvidia_driver_package_version |
"" |
インストールするパッケージのバージョン。これはインストールするdebまたはRPMパッケージの実際のバージョンと一致する必要があります。 |
nvidia_driver_persistence_mode_on |
yes |
永続モードを有効にするかどうか(真偽値) |
nvidia_driver_skip_reboot |
no |
インストール中にノードの再起動をスキップするかどうか |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
NVIDIAドライバーのパラメータに使用するファイル名 |
nvidia_driver_module_params |
"" |
NVIDIAドライバーに渡すパラメータ |
nvidia_driver_branch |
"515" |
インストールするデフォルトドライバーブランチ |
Red Hat特有の変数
変数名 | デフォルト値 | 説明 |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
EPELを有効にするためのパッケージ |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
CUDAリポジトリのベースURL |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
CUDAリポジトリのGPGキー |
Ubuntu特有の変数
Ubuntuのインストールでは、CanonicalリポジトリとNVIDIA CUDAリポジトリからのインストールを選択できます。
デフォルトでは、Canonicalリポジトリが使用され、インストールされるドライバーはヘッドレスサーバードライバーです。
変数名 | デフォルト値 | 説明 |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
CUDAリポジトリを使用するかどうかのフラグ |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
CUDAリポジトリのベースURL |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
CUDAリポジトリからインストールするパッケージ名 |
nvidia_driver_ubuntu_packages_suffix |
"-server" |
インストール時にaptパッケージに追加されるサフィックス |
例のプレイブック
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
サポートされているディストリビューション
現在、このロールは以下のLinuxディストリビューションをサポートしています:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- Red Hat Enterprise Linux 7
- CentOS 8
- Red Hat Enterprise Linux 8
インストール
ansible-galaxy install nvidia.nvidia_driver
ライセンス
bsd-3-clause
ダウンロード
329.2k