stuvusIT.smartd
smartd
Ce rôle installe et configure smartd
.
Dans la configuration par défaut, tous les appareils seront testés et observés, mais aucun e-mail ne sera envoyé.
Exigences
Debian, Ubuntu, Arch Linux ou Fedora.
/usr/bin/mail
doit exister et être configuré pour pouvoir envoyer des e-mails de rapport si cela est souhaité.
Variables du Rôle
Ce rôle utilise uniquement une variable au niveau supérieur appelée smartd_devices
, qui est un dictionnaire de dictionnaires spécifiant la surveillance des appareils.
Chaque clé correspond à un chemin de disque, tandis que DEVICESCAN
(la seule entrée par défaut) peut être utilisée pour scanner les appareils.
Après une entrée DEVICESCAN
, toutes les lignes suivantes sont ignorées par smartd, donc vous voudrez probablement l'insérer à la fin ou pas du tout.
Toutes les options possibles à l'intérieur du dictionnaire sont brièvement décrites ici. Vous pouvez trouver un texte détaillé pour chacune d'elles sur la page de manuel de smartd.
Nom | Obligatoire / Par défaut | Description |
---|---|---|
type |
auto |
Le type de l'appareil, par exemple ata , scsi , marvell , etc. |
nocheck |
standby,15,q |
Paramètre de mode d'alimentation. Par défaut, les appareils en standby ne sont réveillés que tous les 15 essais et les tentatives de contrôle ignorées ne sont pas enregistrées. |
check_type |
normal |
Utilisez normal ou permissive pour forcer le contrôle SMART même s'il n'est pas annoncé. |
ata_offline_testing |
Défini sur on ou off pour activer ou désactiver les tests en ligne ATA automatiques par l'appareil lui-même. Notez que vous devez mettre la valeur entre guillemets à cause de l'interprétation d'ansible de off . |
|
attribute_autosave |
True |
Active ou désactive la sauvegarde automatique des attributs au démarrage |
check_health_return_status |
True |
Vérifie l'état de santé de l'appareil en utilisant le statut de retour SMART |
report_error_types |
[error,xerror,selftest,offlinests,"scterc,0,0"] |
Liste des types d'erreurs à signaler. Par défaut, les erreurs SMART ainsi que les tests échoués sont enregistrés et TLER sera désactivé. |
non_smart_settings |
["lookahead,on"] |
Liste des options non-SMART à définir |
test_schedule |
(L/../../6/01|S/../.././02) |
REGEXP pour spécifier les horaires des auto-tests. Par défaut, un test court est exécuté quotidiennement après 1h du matin. Un test long est exécuté chaque dimanche après 2h du matin. |
mail_recipients |
[] |
Liste d'adresses e-mail pour rapporter |
mail_frequency |
diminishing |
Fréquence des e-mails de rapport. Les valeurs possibles sont once , daily et diminishing . |
mail_script |
Chemin vers un script qui sera exécuté en plus de l'envoi de rapports par e-mail | |
report_ata_failure |
True |
Signaler l'échec de tout attribut d'utilisation ATA |
report_ata_prefail |
True |
Signaler le changement de tout attribut d'alerte ATA |
report_ata_usage |
False |
Signaler chaque fois qu'un attribut d'utilisation a changé |
ignore_ata_failure_ids |
[] |
Liste des ID SMART à ignorer lors de la vérification des échecs |
ignore_ata_usage_ids |
[] |
Liste des ID SMART à ignorer lors du suivi des changements de valeur d'utilisation |
report_raw_ids |
[] |
Liste des ID pour forcer le rapport des valeurs brutes. Ajoutez ! à un ID pour considérer les changements comme critiques. |
ata_pending_id |
197+ |
ID spécifiant les secteurs en attente. Ajoutez + pour signaler uniquement l'augmentation au lieu de la valeur non nulle. |
ata_uncorrectable_id |
198+ |
ID spécifiant les secteurs non corrigibles. Ajoutez + pour signaler uniquement l'augmentation au lieu de la valeur non nulle. |
temperature_report_diff |
10 |
Différence de température à signaler. Utilisez 0 pour ignorer. |
temperature_report_info |
45 |
Seuil de température pour commencer à envoyer des rapports d'information. Utilisez 0 pour ignorer. |
temperature_report_crit |
50 |
Seuil de température pour commencer à envoyer des rapports critiques. Utilisez 0 pour ignorer. |
firmware_bugs |
[] |
Liste des bugs de firmware connus que SMARTD devrait contourner. |
vendor_formats |
[] |
Liste des options pour réécrire l'interprétation des valeurs SMART brutes et leur interprétation. |
preset_mode |
use |
Défini sur ignore si vous ne voulez pas utiliser des préréglages connus pour un disque détecté. |
Exemple de Playbook
- hôtes: stockage
rôles:
- rôle: smartd
smartd_devices:
/dev/sda:
check_type: permissive
test_schedule: L/../../7/04
temperature_report_diff: 5
DEVICESCAN:
non_smart_settings:
- lookahead,on
- wcache,off
- standby,off
- apm,254
Cette configuration forcera le contrôle SMART même s'il n'est pas annoncé sur /dev/sda
. L'appareil ne sera testé qu'après 4h du matin chaque dimanche et tous les changements de température de 5 degrés seront signalés. Tous les autres disques seront surveillés avec les paramètres par défaut, sauf pour les options répertoriées en plus.
Licence
Ce travail est sous Licence Creative Commons Attribution-ShareAlike 4.0 International.
Informations sur l'Auteur
Installs smartmontools and configures smartd
ansible-galaxy install stuvusIT.smartd