我们有许多 IBM x86 服务器,需要监控硬件问题(磁盘故障/温度/风扇)。其中约 50% 的服务器已连接 IMM 端口,我们能够使用 Nagios 监控 SNMP 陷阱。如果出现任何硬件问题,IMM 将向 Nagios 服务器 IP 发送陷阱,然后我们会收到通知。
这里的问题是,我们在各个位置都有很多服务器,无法连接 IMM 端口。我们是否可以在这些服务器上安装代理来监控硬件故障?不需要 IMM 端口连接并使用常规网络接口的东西?这些服务器上运行的操作系统是 Windows 和 RHEL。
我们可以安装 Nagios 代理(nsclient++ 或 NRPE),但根据我收到的信息,他们无法读取硬件信息。
我有什么选择?
答案1
您可以使用各种 check_ipmi 变体通过 NRPE 运行或check_by_ssh
(至少在 Linux 中)如果您加载内核 IPMI 模块。
首先加载(即 modprobe)ipmi_devintf
并ipmi_si
。
有些检查使用ipmitools
,其他检查可能使用openipmi
或freeipmi
。您必须寻找一个满足您需求的检查。(它们也可能能够使用 LAN 上的 IPMI 通过 IMM 检查硬件。)
但我不知道您能为 Windows 做什么。
答案2
就像 Keith 所说的那样,您可以通过加载内核 IPMI 来实现这一点。您可以通过 Nagios 来实现这一点,但我建议您尝试潘多拉FMS以及他们对 IPMI 的看法。Pandora FMS 是一个鲜为人知的监控解决方案,我一直在测试和研究它,我开始推荐它作为其他解决方案的替代方案。