在VMware ESXi 5.5服务器上监控DELL硬件

在VMware ESXi 5.5服务器上监控DELL硬件

尽管我在网上对这个主题进行了大量研究(公平地说,我不是全职系统管理员),但我还是无法弄清楚这一点。

我们有一堆 VMWare ESXi 5.5 服务器,其中一些集成到 vSphere 中,有些则没有(出于成本原因)。

它们全部运行标准 ESXi 映像,只有一台机器实际上运行的是 DELL VMWare ESXi 映像。

我想要完成的事情似乎很简单:配置系统,以便可以通过 SNMP 从远程主机进行查询,无论是 snmpwalk、Nagios、PRTG 等。我想查看来自温度传感器、已安装磁盘及其状态、风扇速度、PSU 状态等的信息。

我原以为安装 DELL 的 VMWare 版本会自动启用必要的模块(最重要的是 OpenManage),但事实似乎并非如此。

我有相互矛盾的信息,不知道这是否可能,一些文档说您无法通过 SNMP 查询 DELL VMWare ESXi 服务器,您需要使用 CIM 客户端。然后是可以安装的 OMSA VIB,等等。

我认为这是一个相当普遍的要求,但可用的文档却将其拉向不同的方向。

我尝试做的事情(没有完整的 vSphere 环境)可行吗?

答案1

是的,您可以使用任何 SNMP 监控软件监控独立 ESXi 主机,但某些项目可能只有使用支持 CIM 协议的监控工具才可见。

我的所有 ESXi 主机都是 vCenter 的一部分,但我们使用 SolarWinds NPM 直接监控它们(使用 vmkernal 主机 IP 地址)。ESXi 5.5 内置了 5 或 6 个 CIM 模块,可为您提供硬件运行状况,但 RAID 卡运行状况不是其中之一。您需要添加 Dell OMSA VIB,以添加其他 CIM 代理,包括用于 RAID 阵列的代理。Brian Atkinson 的帖子仍然是我发现的描述该过程的最佳帖子,

https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi

如果您要使用提供历史信息和警报的第三方监控工具,则只需按照安装 OMSA ESXi VIB 的说明进行操作即可。如果您希望使用 Dell OMSA 服务器,则可以将其远程安装在基本服务器上、远程安装在 VM 中或本地作为 VM 安装。

在 ESXi 主机上安装 OMSA VIB 后,您可以使用 OMSA 服务器连接到 DRAC 和 iDRAC 带外 (OOB/IPMI/iLo) 管理卡或 ESXi 主机。不过,您不会在 DRAC 或 iDRAC 中看到 RAID 运行状况信息 - 仅在将 OMSA 服务器连接到 ESXi 主机时 - 我重复了服务器关键字,这样就不会混淆充当客户端的服务器和安装在 ESXi 主机上的 OMSA VIB。

一些有用的资源:

显示 ESXi 主机上的当前 CIM 提供程序 https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715

从主机的 CLI 显示 ESXi 主机上当前安装的 VIB, esxcli software vib list

当您直接连接到 vCenter 服务器而不是 ESXi 主机时,您会看到一些额外的硬件运行状况详细信息,但通常如果您在配置/运行状况面板中看不到所需的硬件运行状况,则说明您缺少 CIM 提供程序,您需要在 ESXi 主机上找到并安装 VIB。当您将 Dell OMSA VIB 添加到 ESXi 主机时,您将看到一个存储传感器添加到运行状况页面,该页面显示存储控制器的 RAID 卷、驱动器、控制器和电池运行状况。您可能需要重置传感器才能使其显示,有时在 VIB 安装和重新启动 ESXi 主机后第一次显示需要 15 到 20 分钟。

如果您在连接 vSphere Client 时没有在 ESXi 主机的“健康状态”页面上看到传感器,那么当您使用监控软件远程轮询传感器时很可能也看不到它。

您还应注意,并非所有服务器都具有相同的传感器,并且您可能无法从所有服务器获取相同的健康状态,具体取决于服务器硬件、RAID 卡和可用于组合的 CIM 版本。您可能还需要升级或更改 RAID 卡的 VIB,以使健康状态正常工作。CIM 提供程序(在本例中为 OMSA VIB)通过设备 VIB(真实设备驱动程序)与硬件通信,并将此信息传递给 ESXi 主机上的 CIM 代理 - 也称为小型 CIM 代理守护程序 (sfcbd)。当您使用强大的监控软件轮询 ESXi 主机的硬件健康状况时,它将使用 SNMP 查询获取一些信息,一些使用 CIM 获取一些信息,一些使用 ESXi API(即 SOAP 请求)。CIM 客户端与 ESXi 主机上的 sfcbd 进程对话。

有时 CIM 进程会停止工作。发生这种情况时,您将在 ESXi 主机上重新启动 sfcbd-watchdog 进程。这将重新启动 sfcbd 服务,CIM 轮询将再次工作。从主机的 CLI,/etc/init.d/sfcbd-watchdog restart

我认为这涵盖了您跑步所需的大部分物品。

答案2

我知道您在寻找什么;有关如何管理和监控独立 VMware ESXi 主机的运行状况的具体说明。

在实践中,方法应该略有不同。我将解释如何管理主机。

如果您有多个 ESXi 主机受 vCenter 管理,则假设您利用 vCenter 进行监控和健康状况而不是查询单个主机。有一个综合报警装置我在 vCenter 中配置了“主机硬件健康”警报。我通常不关心它是电源、RAM、磁盘还是任何其他组件,而是关心主机是否不健康。

监控独立的 ESXi 主机不会有太大帮助,因为 Dell/HP 驱动程序的目的是向 vCenter 公开信息。我不认为以这种方式查询单个主机是最佳做法。当然,这是因为您理想情况下希望集中管理您的 VM 主机。

如果您使用单个主机运行 vCenter,您确实会获得此功能,因此这也许是您的环境的一个选择。

如果您需要某种带外监控,您是否不能查询 DRAC 呢?

答案3

你可以使用优秀的https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details(无论是否使用 nagios),它利用 vmware api 获取硬件监控所需的所有信息:

check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green 

您需要 perl vmware sdk,但除此之外,它非常简单。它适用于所有类型的硬件(只要 vmware api 可以看到传感器,就会对其进行检查)。

答案4

尝试 zabbix (http://zabbix.com):

1)它是完美的,众所周知的世界级监控软件

2)您可以轻松启动 Zabbix 设备,也可将其作为预配置的虚拟映像(基于 OpenSuSE)。

3) 它可以使用 Vmware Web 服务(如 Web 客户端)监控 ESX[I] 主机和机器。您可以使用低级发现规则自动发现 VMware 虚拟机管理程序和虚拟机,并根据预定义的主机原型创建主机来监控它们。

4)您将能够通过 iDrac 使用 SNMP 监控戴尔服务器的整个硬件,包括 raid 控制器及其卷状态、物理磁盘/内存模块/PSU 等等……

所有类型的硬件状态信息 [在 iDrac 中可用] 都可以通过 SNMP 访问(至少在具有 IDrac 7/8 的服务器上 - 我已经以这种方式为我的公司实施了对 50 多台 Dell 12/13 代服务器的硬件监控)。

借助zabbix完善的LLD(低级发现)功能,您可以轻松收集所有硬件组件进行监控,而无需手动枚举,并自动创建监控项(状态,温度,风扇速度,磁盘大小和序列号等),触发器(处理监控数据的表达式)和各种操作...

相关内容