stuvusIT.smartd
smartd
Ce rôle installe et configure smartd.
Dans la configuration par défaut, tous les appareils seront testés et observés, mais aucun e-mail ne sera envoyé.
Exigences
Debian, Ubuntu, Arch Linux ou Fedora.
/usr/bin/mail doit exister et être configuré pour pouvoir envoyer des e-mails de rapport si cela est souhaité.
Variables du Rôle
Ce rôle utilise uniquement une variable au niveau supérieur appelée smartd_devices, qui est un dictionnaire de dictionnaires spécifiant la surveillance des appareils.
Chaque clé correspond à un chemin de disque, tandis que DEVICESCAN (la seule entrée par défaut) peut être utilisée pour scanner les appareils.
Après une entrée DEVICESCAN, toutes les lignes suivantes sont ignorées par smartd, donc vous voudrez probablement l'insérer à la fin ou pas du tout.
Toutes les options possibles à l'intérieur du dictionnaire sont brièvement décrites ici. Vous pouvez trouver un texte détaillé pour chacune d'elles sur la page de manuel de smartd.
| Nom | Obligatoire / Par défaut | Description |
|---|---|---|
type |
auto |
Le type de l'appareil, par exemple ata, scsi, marvell, etc. |
nocheck |
standby,15,q |
Paramètre de mode d'alimentation. Par défaut, les appareils en standby ne sont réveillés que tous les 15 essais et les tentatives de contrôle ignorées ne sont pas enregistrées. |
check_type |
normal |
Utilisez normal ou permissive pour forcer le contrôle SMART même s'il n'est pas annoncé. |
ata_offline_testing |
Défini sur on ou off pour activer ou désactiver les tests en ligne ATA automatiques par l'appareil lui-même. Notez que vous devez mettre la valeur entre guillemets à cause de l'interprétation d'ansible de off. |
|
attribute_autosave |
True |
Active ou désactive la sauvegarde automatique des attributs au démarrage |
check_health_return_status |
True |
Vérifie l'état de santé de l'appareil en utilisant le statut de retour SMART |
report_error_types |
[error,xerror,selftest,offlinests,"scterc,0,0"] |
Liste des types d'erreurs à signaler. Par défaut, les erreurs SMART ainsi que les tests échoués sont enregistrés et TLER sera désactivé. |
non_smart_settings |
["lookahead,on"] |
Liste des options non-SMART à définir |
test_schedule |
(L/../../6/01|S/../.././02) |
REGEXP pour spécifier les horaires des auto-tests. Par défaut, un test court est exécuté quotidiennement après 1h du matin. Un test long est exécuté chaque dimanche après 2h du matin. |
mail_recipients |
[] |
Liste d'adresses e-mail pour rapporter |
mail_frequency |
diminishing |
Fréquence des e-mails de rapport. Les valeurs possibles sont once, daily et diminishing. |
mail_script |
Chemin vers un script qui sera exécuté en plus de l'envoi de rapports par e-mail | |
report_ata_failure |
True |
Signaler l'échec de tout attribut d'utilisation ATA |
report_ata_prefail |
True |
Signaler le changement de tout attribut d'alerte ATA |
report_ata_usage |
False |
Signaler chaque fois qu'un attribut d'utilisation a changé |
ignore_ata_failure_ids |
[] |
Liste des ID SMART à ignorer lors de la vérification des échecs |
ignore_ata_usage_ids |
[] |
Liste des ID SMART à ignorer lors du suivi des changements de valeur d'utilisation |
report_raw_ids |
[] |
Liste des ID pour forcer le rapport des valeurs brutes. Ajoutez ! à un ID pour considérer les changements comme critiques. |
ata_pending_id |
197+ |
ID spécifiant les secteurs en attente. Ajoutez + pour signaler uniquement l'augmentation au lieu de la valeur non nulle. |
ata_uncorrectable_id |
198+ |
ID spécifiant les secteurs non corrigibles. Ajoutez + pour signaler uniquement l'augmentation au lieu de la valeur non nulle. |
temperature_report_diff |
10 |
Différence de température à signaler. Utilisez 0 pour ignorer. |
temperature_report_info |
45 |
Seuil de température pour commencer à envoyer des rapports d'information. Utilisez 0 pour ignorer. |
temperature_report_crit |
50 |
Seuil de température pour commencer à envoyer des rapports critiques. Utilisez 0 pour ignorer. |
firmware_bugs |
[] |
Liste des bugs de firmware connus que SMARTD devrait contourner. |
vendor_formats |
[] |
Liste des options pour réécrire l'interprétation des valeurs SMART brutes et leur interprétation. |
preset_mode |
use |
Défini sur ignore si vous ne voulez pas utiliser des préréglages connus pour un disque détecté. |
Exemple de Playbook
- hôtes: stockage
rôles:
- rôle: smartd
smartd_devices:
/dev/sda:
check_type: permissive
test_schedule: L/../../7/04
temperature_report_diff: 5
DEVICESCAN:
non_smart_settings:
- lookahead,on
- wcache,off
- standby,off
- apm,254
Cette configuration forcera le contrôle SMART même s'il n'est pas annoncé sur /dev/sda. L'appareil ne sera testé qu'après 4h du matin chaque dimanche et tous les changements de température de 5 degrés seront signalés. Tous les autres disques seront surveillés avec les paramètres par défaut, sauf pour les options répertoriées en plus.
Licence
Ce travail est sous Licence Creative Commons Attribution-ShareAlike 4.0 International.
Informations sur l'Auteur
Installs smartmontools and configures smartd
ansible-galaxy install stuvusIT.smartd