ESXi 服务器健康监控

ESXi 服务器健康监控

正如 VMware 所说,现在是时候了!我已开始阅读并计划从 vSphere ESX 4.0 升级到 vSphere ESXi 4.1。虽然我知道 vSphere 5 应该会在今年秋季某个时候推出,但我非常确定这个初步计划也适用于该版本。我的主要担忧之一是我希望能够有效地监控主机的健康状况。我的问题分为两部分:1) 我当前的设置是否仍然有效,2) 还有哪些其他建议?

我目前用于监控服务器运行状况和故障警报的设置是以下设置的组合:iDRAC6警报和妇女组(Whats Up Gold)捕获 SNMP 陷阱。如果服务器上的某些物理设备(存储事件除外)出现故障或降级,iDRAC6 可以向 SMTP 服务器发送邮件。服务器还配置为向 WUG 发送 SNMP 陷阱,WUG 会监控存储事件,并且是其他事件的辅助通知。为了获得此设置,我通过服务控制台编辑了 SNMPD.CONF 文件,当然,服务控制台即将消失。如果我尝试继续,似乎可以采用新的方法来执行此操作,详见此处VMware 知识库。是否有人使用 SNMP 陷阱设置来监控他们的硬件并完成所描述的设置?

我的问题的第二部分是:有没有更好的方法来监控主机的健康状况?我知道还有其他方法,但我不想争论,还有哪些更好的方法来监控主机的健康状况?我一直在研究 CIM,但我不知道另一端是什么,它解释了 CIM 所说的内容是错误的。其他人都使用什么方法来获取这些数据?

答案1

我使用来自 (i)DRAC 的数据,结合 ESXi 通过 CIM 收集的数据,并将 vCenter 配置为对来自 CIM 监控的故障发出警报。

我不太清楚您所说的 CIM 数据的可信度,但我个人对它的信任程度远高于对提供给 WhatsUp 的 SNMP 陷阱的信任程度。只要您的硬件得到良好支持(如最近的戴尔设备),CIM 就会捕获并发出诸如 BIOS 电池电压低之类的小问题警报,而 vCenter 在选择发出这些事件警报的内容、位置和频率方面非常灵活。

答案2

如果你的主机是戴尔的,我强烈建议你看看适用于 vCenter 的戴尔管理插件。这是一款制作精良的工具,它能够在 vCenter 框架内启用许多硬件特定的警报,而这些警报是您在其他地方无法获得的。它不是免费产品,但价格合理,而且效果值得。

答案3

看:VMWare vSphere 以及从 ESX 到 ESXi 的迁移

对于监控问题,我假设大多数人都会使用专门为相关硬件构建的 ESXi 版本来监控系统,并通过监控来自 Virtual Center 的陷阱来监控系统。

相关内容