stuvusIT.smartd
smartd
Este rol instala y configura smartd
.
En la configuración por defecto, se probarán y observarán todos los dispositivos, pero no se enviarán correos.
Requisitos
Debian, Ubuntu, Arch Linux o Fedora
Es necesario que exista y esté configurado /usr/bin/mail
para poder enviar correos de reportes si se desea.
Variables del Rol
Este rol solo utiliza una variable de nivel superior llamada smartd_devices
, que es un diccionario de diccionarios para especificar la supervisión de dispositivos. Cada clave corresponde a una ruta de unidad, mientras que DEVICESCAN
(la única entrada por defecto) se puede usar para escanear dispositivos. Después de una entrada DEVICESCAN
, todas las líneas siguientes son ignoradas por smartd, así que probablemente quieras insertarla al final o no usarla en absoluto.
Todas las opciones posibles dentro del diccionario se describen brevemente aquí. Puedes encontrar una explicación detallada para cada una en la página del manual de smartd.
Nombre | Obligatorio / Por defecto | Descripción |
---|---|---|
type |
auto |
El tipo de dispositivo, por ejemplo ata , scsi , marvell , etc. |
nocheck |
standby,15,q |
Configuración del modo de potencia. Por defecto, los dispositivos en standby solo se despiertan cada 15 intentos y las pruebas omitidas no se registran. |
check_type |
normal |
Usa normal o permissive para forzar la verificación SMART, incluso si no está anunciada. |
ata_offline_testing |
Configurar en on o off para habilitar o deshabilitar pruebas automáticas ATA offline por el propio dispositivo. Nota que debes citar el valor por la interpretación de off en ansible. |
|
attribute_autosave |
True |
Habilitar o deshabilitar el guardado automático de atributos al iniciar |
check_health_return_status |
True |
Comprobar el estado de salud del dispositivo utilizando el estado de retorno SMART |
report_error_types |
[error,xerror,selftest,offlinests,"scterc,0,0"] |
Lista de tipos de error para reportar. Por defecto, se registran los errores SMART así como las pruebas fallidas y se deshabilitará TLER. |
non_smart_settings |
["lookahead,on"] |
Lista de opciones no SMART para configurar |
test_schedule |
(L/../../6/01|S/../.././02) |
REGEXP para especificar horarios de auto-pruebas. Por defecto, se ejecuta una prueba corta diariamente después de la 1 am. Se ejecuta una prueba larga cada domingo después de las 2 am. |
mail_recipients |
[] |
Lista de direcciones de correo para enviar reportes |
mail_frequency |
diminishing |
Frecuencia de correos de reportes. Valores posibles: once , daily y diminishing . |
mail_script |
Ruta a un script que se ejecutará además de enviar correos de reportes | |
report_ata_failure |
True |
Reportar fallos en cualquier atributo de uso ATA |
report_ata_prefail |
True |
Reportar cambios en cualquier atributo de prefail ATA |
report_ata_usage |
False |
Reportar cualquier cambio en un atributo de uso |
ignore_ata_failure_ids |
[] |
Lista de IDs SMART a ignorar al verificar fallas |
ignore_ata_usage_ids |
[] |
Lista de IDs SMART a ignorar al rastrear cambios en el valor de uso |
report_raw_ids |
[] |
Lista de IDs para forzar la presentación de valores crudos. Agrega ! a un ID para considerar cambios críticos. |
ata_pending_id |
197+ |
ID que especifica sectores pendientes. Agrega + para reportar solo incrementos en lugar de no ser cero. |
ata_uncorrectable_id |
198+ |
ID que especifica sectores pendientes. Agrega + para reportar solo incrementos en lugar de no ser cero. |
temperature_report_diff |
10 |
Diferencia de temperatura para reportar. Usa 0 para ignorar. |
temperature_report_info |
45 |
Umbral de temperatura para comenzar a enviar reportes informativos. Usa 0 para ignorar. |
temperature_report_crit |
50 |
Umbral de temperatura para comenzar a enviar reportes críticos. Usa 0 para ignorar. |
firmware_bugs |
[] |
Lista de errores de firmware conocidos que SMARTD debería evitar. |
vendor_formats |
[] |
Lista de opciones para reescribir la interpretación de los valores crudos SMART y su interpretación. |
preset_mode |
use |
Configurar en ignore si no deseas usar presets conocidos para una unidad detectada. |
Ejemplo de Playbook
- hosts: storage
roles:
- role: smartd
smartd_devices:
/dev/sda:
check_type: permissive
test_schedule: L/../../7/04
temperature_report_diff: 5
DEVICESCAN:
non_smart_settings:
- lookahead,on
- wcache,off
- standby,off
- apm,254
Esta configuración forzará la verificación SMART incluso si no se anuncia como implementada en /dev/sda
. El dispositivo solo se probará después de las 4 am cada domingo y se informarán cambios de temperatura de 5 grados.
Todos los demás discos se supervisarán con la configuración por defecto, excepto por las opciones listadas que se establecieron adicionalmente.
Licencia
Este trabajo está licenciado bajo una Licencia Creative Commons Attribution-ShareAlike 4.0 International.
Información del Autor
Installs smartmontools and configures smartd
ansible-galaxy install stuvusIT.smartd