使用本地 IPMI 和 Nagios 监控 PSU

使用本地 IPMI 和 Nagios 监控 PSU

我想使用 Nagios 来监控我的服务器(运行 Debian Wheezy)中的冗余 PSU。

我已经运行了包sensors-detect中的脚本lm-sensors,它唯一能找到的是

Driver `ipmisensors':
  * ISA bus, address 0xca2
    Chip `IPMI BMC KCS' (confidence: 8)

然后我安装了freeipmi-tools,我发现我可以从中获得一些有用的输出ipmi-sensors

$ sudo ipmi-sensors --group='Power Supply'
5: Power Supply 1 (Power Supply): [Presence detected]
6: Power Supply 2 (Power Supply): [Presence detected]
7: Power Supplies (Power Supply): [Fully Redundant]

我可以编写一个 Nagios 插件在本地运行ipmi-sensors、解析其输出并在其发生变化时发出警报,但我不愿意依赖保持不变的输出格式,而且我不知道如何获得更机器可读的输出。

我看过检查ipmi传感器,但它似乎只能在网络上有 IPMI 设备时运行;而我的则没有。

有没有比解析输出更好的方法ipmi-sensors

答案1

Nagios Exchange 中列出了其他几个 IPMI 插件。有时,这里比 Google 更适合作为搜索的起点。

例如:

  • 检查IPMI可以在本地主机上操作,使用ipmitool
  • 检查IPMI也可以使用 localhostfree-ipmi

答案2

没有必要解析 IPMI 数据。它需要一个 CPU 线程来读取,一个线程来解析,如果您要扩展到数据中心大小的系统,数千台服务器,那么线程就很多了。相反,使用 API、java(Vrx 或 Hemi)或 C 库(ipmitool 或 freeipmi)直接访问 IPMI 数据。数据中心(40 k 服务器)每分钟可以读取 600 万个 IPMI 传感器,线程创建成为限制因素。

API 的优点在于,它可以报告 IPMB 总线写入错误(例如总线忙或存在持久硬件错误),然后您可以决定重试检索数据。

相关内容