grycap.nvidia_driver
rola-ansible-nvidia-driver
Rola Ansible do instalacji sterownika NVIDIA z repozytoriów NVIDIA CUDA.
Wymagania
Podczas instalacji sterownika NVIDIA, ta rola zresetuje węzły, na których jest uruchamiana.
Z tego powodu zdecydowanie zalecamy, aby uruchomić ansible-playbook
z innego węzła niż węzły GPU, na których instalujesz sterownik.
Jeśli spróbujesz uruchomić Ansible na tym samym węźle, gdzie instalujesz sterownik, ta rola:
- Odrzuci dalsze działanie z błędem:
Running reboot with local connection would reboot the control node
(jeśli działa z użyciem połączenialocal
) - Zresetuje węzeł, na którym działa, przerywając wykonywanie playbooka! (jeśli działa z połączeniem
ssh
z localhost)
Instalacja
Tę rolę można zainstalować za pomocą Ansible Galaxy:
$ ansible-galaxy install grycap.nvidia_driver
Zmienne roli
Zmienna | Wartość domyślna | Opis |
---|---|---|
nvidia_driver_package_version |
"" |
Wersja pakietu do zainstalowania. Należy pamiętać, że powinna odpowiadać rzeczywistej wersji pakietu deb lub RPM do zainstalowania. |
nvidia_driver_persistence_mode_on |
yes |
Czy włączyć tryb trwałości (boolean) |
nvidia_driver_skip_reboot |
no |
Czy pominąć restart węzła podczas instalacji |
nvidia_driver_module_file |
"/etc/modprobe.d/nvidia.conf" |
Nazwa pliku do użycia dla parametrów sterownika NVIDIA |
nvidia_driver_module_params |
"" |
Parametry do przekazania do sterownika NVIDIA |
Zmienne specyficzne dla Red Hat
Zmienna | Wartość domyślna | Opis |
---|---|---|
epel_package |
"https://dl.fedoraproject.org/pub/epel/epel-release-latest-{{ ansible_distribution_major_version }}.noarch.rpm" |
Pakiet do zainstalowania w celu włączenia EPEL |
nvidia_driver_rhel_cuda_repo_baseurl |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/" |
Podstawowy URL do repo CUDA |
nvidia_driver_rhel_cuda_repo_gpgkey |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _rhel_repo_dir }}/7fa2af80.pub" |
Klucz GPG dla repo CUDA |
Zmienne specyficzne dla Ubuntu
Dla instalacji na Ubuntu masz możliwość instalacji z repozytoriów Canonical oraz z repozytoriów NVIDIA CUDA.
Domyślnie będą używane repozytoria Canonical, a zainstalowany sterownik to sterownik serwera bez głowy.
Zmienna | Wartość domyślna | Opis |
---|---|---|
nvidia_driver_ubuntu_install_from_cuda_repo |
no |
Flaga, czy użyć repo CUDA |
nvidia_driver_ubuntu_branch |
450 |
Gałąź sterownika do użycia podczas instalacji |
nvidia_driver_ubuntu_packages |
["nvidia-headless-450-server", "nvidia-headless-450-utils"] |
Nazwy pakietów do zainstalowania z repozytorium Canonical |
nvidia_driver_ubuntu_cuda_repo_baseurl |
"http://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}" |
Podstawowy URL do repo CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_url |
"https://developer.download.nvidia.com/compute/cuda/repos/{{ _ubuntu_repo_dir }}/7fa2af80.pub" |
Klucz GPG dla repo CUDA |
nvidia_driver_ubuntu_cuda_repo_gpgkey_id |
"7fa2af80" |
ID klucza GPG dla repo CUDA |
nvidia_driver_ubuntu_cuda_package |
"cuda-drivers" |
Nazwa pakietu do zainstalowania z repo CUDA |
Przykładowy playbook
- hosts: gpu_nodes
roles:
- nvidia.nvidia_driver
Obsługiwane dystrybucje
Obecnie ta rola obsługuje następujące dystrybucje Linuksa:
- NVIDIA DGX OS 4
- NVIDIA DGX OS 5
- Ubuntu 18.04 LTS
- Ubuntu 20.04 LTS
- CentOS 7
- CentOS 8
- Red Hat Enterprise Linux 7
Zainstaluj
ansible-galaxy install grycap.nvidia_driver
Licencja
bsd-3-clause
Pobrania
2.1k
Właściciel
Grid y Computación de Altas Prestaciones