标题确实很容易理解!如果物理磁盘健康状况下降,我该如何触发电子邮件?另外,顺便问一下,我该如何对软件 raid 或 zfs 阵列健康状况做类似的事情?
答案1
这取决于多种因素。许多 raid 控制器都有自己的工具来查询此类信息;
HP 的 SmartArray 控制器使用 HP 的
hpacucli
工具。我一般建议使用这个 nagios 插件用于检查这些磁盘的运行状况以及 HP 服务器的总体运行状况。DELL 的服务器有自己的
openmanage
驱动程序需要查询。可以找到一个好的 Nagios 插件这里。如果你的硬盘支持 SMART(我相信现在所有的硬盘都支持),你可以使用检查智能门锁。
以上两种方法都会检查 RAID 状态以及物理驱动器。在某些情况下,如果您确保不时更新插件 - 您还会被告知何时适合更新固件。
答案2
在 Ubuntu 上使用 Smartmontools。以下是一个很好的教程,我在我的家用台式机上用过。由于这是台式机,我使用 GSmartControl,它提供了一个很好的界面。
https://help.ubuntu.com/community/Smartmontools
对于我的生产服务器(不是 Ubuntu),我仍然使用 Smartmontools。它虽然过时了,但却是最好的工具。