如何检查 smartd 和 mdadm 是否正常运行?

如何检查 smartd 和 mdadm 是否正常运行?

我在 Debian 上有一个 raid 系统:

Disk /dev/sda: 320.1 GB,...
   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1        2432    19535008+  fd  Linux raid autodetect
/dev/sda2            2433        2918     3903795   fd  Linux raid autodetect
/dev/sda3            2919       38913   289129837+  fd  Linux raid autodetect

Disk /dev/sdb: 320.1 GB, ...
   Device Boot      Start         End      Blocks   Id  System
/dev/sdb1   *           1        2432    19535008+  fd  Linux raid autodetect
/dev/sdb2            2433        2918     3903795   fd  Linux raid autodetect
/dev/sdb3            2919       38913   289129837+  fd  Linux raid autodetect

# df -h 
/dev/md0               19G   12G  6,0G  66% /      type ext3 (rw)
/dev/md2              272G  245G   25G  91% /var   type ext3 (rw)

我想检查一切是否运行正常并进行配置,这样如果出现任何错误我就会收到一封电子邮件。


我的唯一一行/etc/smartd.conf是:

DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner

这会扫描那 2 个 raid 设备吗?

我的电脑里/etc/cron.d/mdadm有这样一行:
57 0 * * 0 root if [ -x /usr/share/mdadm/checkarray ] && [ $(date +\%d) -le 7 ]; then /usr/share/mdadm/checkarray --cron --all --idle --quiet; fi

其中/usr/share/mdadm/checkarray说:它启动对 MD 阵列冗余信息的检查运行

答案1

如果您想要监控硬盘的可靠性,请安装smartmontools提供实用程序来检查硬盘是否出现磁盘性能下降和故障的软件包,使用大多数现代 ATA 和 SCSI 硬盘内置的自我监控、分析和报告技术系统 (SMART)。

该软件包包含smartctl可用于从命令行检查硬盘的工具和smartd守护进程,该守护进程以指定的时间间隔检查硬盘并将警告/错误记录到系统日志,还可以将警告和错误发送到指定的电子邮件地址。

要启用守护进程,您必须取消注释start_smart文件中的行/etc/default/smartmontools。然后,您必须在文件中定义/etc/smartd.conf要监视的硬盘并启动服务smartmontools(检查男人智能smartd.conf 文件有关详细说明,此外,此文件中还有许多示例):

/dev/sda  -m [email protected] -M exec /usr/share/smartmontools/smartd-runner
/dev/sdb  -m [email protected] -M exec /usr/share/smartmontools/smartd-runner

您可以使用工具监控您的 md 设备mdadm。如果您想接收带有警报的电子邮件,请在文件中定义邮件收件人/etc/mdadm.conf(详细信息配置文件男子mdadm):

MAILADDR [email protected]

然后,通过 cron 安排此命令(安排周期由您决定):

mdadm --monitor --scan -1

相关内容