RHEL 如何向用户发出 RAID 配置中硬盘故障的警报?

RHEL 如何向用户发出 RAID 配置中硬盘故障的警报?

不管怎样,我被任命负责一台运行 RHEL6 的大型服务器。它有六个 1.5 TB 的驱动器,采用 RAID5 配置。我了解 RAID 背后的理论概念,并且我仅通过命令行访问此服务器。服务器本身位于数据中心,对于我这个工作级别的人来说,可以访问该数据中心,但并不容易。因此,如果软件监控是可以接受的,那么对服务器进行例行物理检查可能不是一种有效的途径。

当硬盘出现故障时,作为命令行用户,我在日常使用 shell 时会自动收到警报吗?如果会,如何收到警报?如果没有,推荐使用哪种工具进行简单的监控和警报?

答案1

假设您使用的是硬件 RAID,那么 RHEL 本身只能看到 RAID 所呈现的逻辑驱动器。它不知道底层的物理磁盘。

如果它是戴尔服务器,您可以使用 OpenManage 运行一个警报脚本,该脚本将通过墙壁或电子邮件写入您的控制台。

http://www.howtogeek.com/50555/setup-email-notifications-for-dell-server-hardware-alerts/

以下是在 HP 服务器上执行此操作的一些信息http://blog.mattbrock.co.uk/2010/01/25/monitoring-diskraid-hardware-in-centos-5-on-hp-dl360-servers/

如果您有不同的硬件提供商,他们应该具有类似的功能。

如果你正在使用软件 RAID,这里有一篇很好的文章http://my.sohost.eu/knowledgebase/4/Monitor-Linux-software-RAID-array-with-e-mail-notification.html关于使用 cron 监控 /proc/mdstat 的变化,如果发生则发送电子邮件。

相关内容