LIP-Computing.ansible-role-nvidia
Ansible 角色安装 NVIDIA 驱动
这个角色在 GPU 机器上部署 NVIDIA 驱动,这些机器可以是物理机或虚拟机。
支持的操作系统是 CentOS 7 和 Ubuntu 18.04。
要求
机器或虚拟机应该有一个 NVIDIA GPU,可以使用以下命令检查:
lspci | grep NVIDIA
安装角色
可以直接从 GitHub 安装角色:
ansible-galaxy install git+https://github.com/LIP-Computing/ansible-role-nvidia.git
或者从 Ansible Galaxy:
ansible-galaxy install -f LIP-Computing.ansible-role-nvidia
角色变量
根据机器类型,这些变量应该进行更改。 特别是驱动版本可能需要设置:
nvidia_driver_version: 440.33.01
- NVIDIA 驱动版本,默认值在 defaults/main.yml 中检查,也可以查看有效版本列表。kmod_install: true
- 安装内核模块,仅适用于物理机和虚拟机。dev_create: false
- 仅在kmod_install: true
时运行脚本以在主机上创建设备。nv_persistence: true
- 设置 nvidia-smi --persistence-mode=1。
变量 kmod_install
决定 NVIDIA 内核模块的安装状态。对于 Docker 镜像,值应为 false,而对于物理机或虚拟机,值应为 true。
这些变量有预设值,通常不需要更改:
base_url
:NVIDIA 下载的基本 URLnvidia_driver
:NVIDIA 驱动的文件名,取决于变量nvidia_driver_version
nvidia_url
:NVIDIA 驱动的完整 URL,取决于变量base_url
和nvidia_driver
示例 Playbook
Playbook 示例:在虚拟机上部署驱动版本 440.33.01
- hosts: servers
roles:
- { role: LIP-Computing.ansible-role-nvidia, nvidia_driver_version: 440.33.01, kmod_install: true }
许可证
Apache v2
作者信息
- Mario David: mariojmdavid@gmail.com
- LIP Lisbon: http://www.lip.pt
- 项目:
- Indigo DataCloud: https://www.indigo-datacloud.eu/
- DEEP Hybrid Datacloud: https://deep-hybrid-datacloud.eu/
- EOSC Synergy: https://www.eosc-synergy.eu/