Ubuntu:监控硬件 RAID 并在发生故障时通知?

Ubuntu:监控硬件 RAID 并在发生故障时通知?

我正在使用3ware 9650SE-2LP Raid 控制器在一些新的 Ubuntu 10.04 x64 服务器中设置 2 驱动器 RAID 1。

当某个驱动器发生故障时,服务器是否有办法向我发送通知?如果可能的话,我更希望通过电子邮件通知。谢谢。

答案1

3ware 提供 3dm2 监控/管理程序。只需查看他们的网页,就会发现有一个适用于 Linux 的二进制版本,而且它甚至可以正常运行 [至少在 debian 下]。

问题是 - 我从不相信那些花哨的工具...所以我按照如下方式操作。所以我使用基于 tw_cli 的自己的脚本 - 也可以从 3ware 网站下载。

我每周巡逻一次阅读:

./tw_cli /c0/u0 start verify

并且每隔 15 分钟我就会转储一次当前的突袭状态:

./tw_cli /c0 show > current.txt

我使用非常简单的 nagios 插件来检查当前状态是否与预期相同 [我只是将文件的内容与一开始获取的众所周知的状态转储进行比较]。

#!/bin/bash

if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then
        echo "CRITICAL - current state of raid does not match expected pattern "
        exit 2
fi

if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then
        echo "CRITICAL - state file is old "
        exit 2
fi
echo "OK"
exit 0

您可能会放置邮件而不是出口 2...或更可能使用 3dm2。

相关内容