LIP-Computing.ansible-role-nvidia

许可证 构建状态

Ansible 角色安装 NVIDIA 驱动

这个角色在 GPU 机器上部署 NVIDIA 驱动,这些机器可以是物理机或虚拟机。

支持的操作系统是 CentOS 7 和 Ubuntu 18.04。

要求

机器或虚拟机应该有一个 NVIDIA GPU,可以使用以下命令检查:

lspci | grep NVIDIA

安装角色

可以直接从 GitHub 安装角色:

ansible-galaxy install git+https://github.com/LIP-Computing/ansible-role-nvidia.git

或者从 Ansible Galaxy:

ansible-galaxy install -f LIP-Computing.ansible-role-nvidia

角色变量

根据机器类型,这些变量应该进行更改。 特别是驱动版本可能需要设置:

  • nvidia_driver_version: 440.33.01 - NVIDIA 驱动版本,默认值在 defaults/main.yml 中检查,也可以查看有效版本列表。
  • kmod_install: true - 安装内核模块,仅适用于物理机和虚拟机。
  • dev_create: false - 仅在 kmod_install: true 时运行脚本以在主机上创建设备。
  • nv_persistence: true - 设置 nvidia-smi --persistence-mode=1。

变量 kmod_install 决定 NVIDIA 内核模块的安装状态。对于 Docker 镜像,值应为 false,而对于物理机或虚拟机,值应为 true

这些变量有预设值,通常不需要更改:

  • base_url:NVIDIA 下载的基本 URL
  • nvidia_driver:NVIDIA 驱动的文件名,取决于变量 nvidia_driver_version
  • nvidia_url:NVIDIA 驱动的完整 URL,取决于变量 base_urlnvidia_driver

示例 Playbook

Playbook 示例:在虚拟机上部署驱动版本 440.33.01

- hosts: servers
  roles:
    - { role: LIP-Computing.ansible-role-nvidia, nvidia_driver_version: 440.33.01, kmod_install: true }

许可证

Apache v2

作者信息

关于项目

NVIDIA GPUs

安装
ansible-galaxy install LIP-Computing.ansible-role-nvidia
许可证
apache-2.0
下载
199
拥有者
LIP Computing group