我想使用 Nagios 来监控我的服务器(运行 Debian Wheezy)中的冗余 PSU。
我已经运行了包sensors-detect
中的脚本lm-sensors
,它唯一能找到的是
Driver `ipmisensors':
* ISA bus, address 0xca2
Chip `IPMI BMC KCS' (confidence: 8)
然后我安装了freeipmi-tools
,我发现我可以从中获得一些有用的输出ipmi-sensors
:
$ sudo ipmi-sensors --group='Power Supply'
5: Power Supply 1 (Power Supply): [Presence detected]
6: Power Supply 2 (Power Supply): [Presence detected]
7: Power Supplies (Power Supply): [Fully Redundant]
我可以编写一个 Nagios 插件在本地运行ipmi-sensors
、解析其输出并在其发生变化时发出警报,但我不愿意依赖保持不变的输出格式,而且我不知道如何获得更机器可读的输出。
我看过检查ipmi传感器,但它似乎只能在网络上有 IPMI 设备时运行;而我的则没有。
有没有比解析输出更好的方法ipmi-sensors
?
答案1
答案2
没有必要解析 IPMI 数据。它需要一个 CPU 线程来读取,一个线程来解析,如果您要扩展到数据中心大小的系统,数千台服务器,那么线程就很多了。相反,使用 API、java(Vrx 或 Hemi)或 C 库(ipmitool 或 freeipmi)直接访问 IPMI 数据。数据中心(40 k 服务器)每分钟可以读取 600 万个 IPMI 传感器,线程创建成为限制因素。
API 的优点在于,它可以报告 IPMB 总线写入错误(例如总线忙或存在持久硬件错误),然后您可以决定重试检索数据。