我正在购买带有冗余电源的 Dell R610。如果其中一个电源发生故障,最好的警报方式是什么?我将运行 Windows Server 2008 R2。由于这台机器将位于主机托管设施中,因此我听不到警报。
答案1
当 Dell OpenManage 检测到 PSU 问题时,它会在事件日志中生成事件。您可以使用任何能够检测事件日志中特定事件的软件来发送通知。您还可以配置警报操作以运行您选择的程序,我猜可能是电子邮件程序等。
我相信通知功能内置于 Dell OpenManage 的 IT Assistant 组件中,但它是一个多组件套件,我不确定它是否属于基线部分,因为我们使用 Microsoft 的 System Center Operations Manager 进行通知,这对于托管设施中的单个服务器来说显然是过度的。如果我没记错的话,IT Assistant 需要在单独的系统上运行。根据托管设施的不同,他们可能会设置一个 IT Assistant,您可以连接到该助手来接收警报。
答案2
ipmitool 可以探测电源。我主要在 Linux 机器上执行此操作,但 Windows 上也有 ipmitool。
# ipmitool sdr type "Power Supply"
Status | 64h | ok | 10.1 | Presence detected
Status | 65h | ok | 10.2 | Presence detected
PS Redundancy | 74h | ok | 7.1 | Fully Redundant
只需编写一个脚本来解析输出并将该输出发送到您的中央监控主机(或让它通过电子邮件发送给您)。
答案3
你可以看看纳吉奥斯。
如果您只想监控电源,那就太过分了。
但是,设置它将允许您监控 OpenManage 生成的任何警报,例如突袭故障、内存问题、机箱风扇等,因为有一个查询 OpenManage 的 Nagios 插件。
除此之外,您还可以监控过度的 RAM 使用情况、硬盘占用情况、CPU 百分比等。
您还可以监控该盒上提供的服务,例如 HTTP、SMTP、FTP 等。
最好的设置方法是使用单独的盒子,如果它不在您要监控的设备现场,那么您可以在停电期间收到警报。它不需要很多电力,可以很容易地成为您办公室或家里的一个旧盒子。
您可以设置电子邮件、手机、火狐插件等警报。您可以配置升级组,以便它首先发送到电子邮件,如果没有得到解决,则发送给文本人#1,仍然没有得到解决,则发送给文本人#2,等等。
基本上,Nagios 可以做的事情非常多,对于任何系统管理员来说,它都是一款很棒的工具。
答案4
如果您正在寻找独立于 R610 本身的监控解决方案,则可以使用以下产品资讯科技监察员WeatherGoose-II 搭配一对 CT-30-60-120 电流变压器,服务器背面的两个交流电源连接各配一个变压器。这样,如果任一电源发生故障,其电流消耗将降至零(或接近零),您可以设置 WeatherGoose-II 在发生这种情况时发送电子邮件或 SNMP 陷阱。
但是,您需要请一位电工打开电源线,从电源线内的三根线中分离出载流的“火”线,以便它可以自己穿过变压器的中心;如果您只是将 CT 夹在整个电源线上,火线和中性线中的反向电流将抵消彼此的磁场,并且 CT 将始终“看到”零电流消耗。
另一种可能是 RCU-H(由 IT Watchdogs 母公司的另一个分支机构生产,但仍可通过该公司购买),它基本上是一个“智能”机架式电源板,可以单独监控和控制每个插座。只需将戴尔服务器的两根电源线插入 RCU-H 上的两个插座,它也可以监控每根电源线的电流消耗,并在任一电源突然停止供电时提醒您。