从 zabbix 通过 ipmi 获取电源状态

从 zabbix 通过 ipmi 获取电源状态

我现在正在寻找一种方法来监控服务器硬件,例如风扇/电源/等。问题是,我们的环境非常动态 - 服务器会自动打开/关闭 - 甚至一天几次,具体取决于负载。

我为我们的超微服务器创建了模板(我们只有 3-4 种类型,因此它们非常具体),其中包含风扇速度检查(0 表示风扇坏了)。但是,每次我关闭服务器时,风扇速度也是 0。

因此我现在正在寻找如何通过 ipmi 获取电源状态(或服务器正在运行的任何其他指标),以便仅在服务器运行时发送 zabbix 警报。

不幸的是,通过 ipmi 是必需的,因为我们通过这种方式监控一些我们无法访问的服务器。

我想避免编写运行类似 ipmitool power status 的脚本。Zabbix 具有出色的 ipmi 集成,因此我想尽可能多地使用它。

ipmitool 传感器返回:

root@virt1:~# ipmitool sensor
System Temp      | 28.000     | degrees C  | ok    | -9.000    | -7.000    | -5.000    | 75.000    | 77.000    | 79.000
CPU Temp         | 0x0        | discrete   | 0x0000| na        | na        | na        | na        | na        | na
FAN 1            | 8355.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 2            | 8355.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 3            | 8725.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 4            | na         | RPM        | na    | na        | na        | na        | na        | na        | na
CPU Vcore        | 1.144      | Volts      | ok    | 0.640     | 0.664     | 0.688     | 1.344     | 1.408     | 1.472
+3.3VCC          | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
+12 V            | 12.031     | Volts      | ok    | 10.494    | 10.600    | 10.706    | 13.091    | 13.197    | 13.303
DIMM             | 1.544      | Volts      | ok    | 1.152     | 1.216     | 1.280     | 1.760     | 1.776     | 1.792
+5 V             | 5.216      | Volts      | ok    | 4.096     | 4.320     | 4.576     | 5.344     | 5.600     | 5.632
+5VSB            | 5.056      | Volts      | ok    | 4.096     | 4.320     | 4.576     | 5.344     | 5.600     | 5.632
VBAT             | 3.232      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
+3.3VSB          | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
AVCC             | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
Chassis Intru    | 0x0        | discrete   | 0x0000| na        | na        | na        | na        | na        | na
PS Status        | 0x1        | discrete   | 0x01ff| na        | na        | na        | na        | na        | na
root@virt1:~#

答案1

一个想法可能是查询电源开/关传感器。它是一个离散传感器,请参阅 https://www.zabbix.com/documentation/2.2/manual/config/items/itemtypes/ipmi 这里有一个如何分析离散传感器状态的示例。

如果无法监控电源开关传感器,您可以读取模拟电压传感器,例如“+5V”(或几个其他电压传感器)。如果电压接近零,则服务器可能已关闭(或电源发生故障)。

答案2

在 Zabbix 2.2 的默认安装中,有两个模板:“Template IPMI Intel SR1530”和“Template IPMI Intel SR1630”。它们都包含一个“Power”项,用于查询“power”传感器的值,这似乎正是您所需要的。如果不是,请描述您在使用该传感器时遇到的问题。

相关内容