我有一台 Dell PowerEdge T710,配有集成的 PERC H700 RAID 控制器。我在镜像 RAID 中运行机器上的两个 500 GB 硬盘。整台机器都在运行 VMWare ESXI 4,我通过 Vsphere 访问机器。
它全天候运行,我想知道我如何才能知道镜像 RAID 是否出现故障并且需要换一个新的驱动器?!
感谢您对这个新手问题的帮助。
答案1
任何主要供应商提供的完全受支持的硬件上的 ESXi 都将生成 VI CLient 中可见的 RAID 控制器警报。由于HCL 上的 H700如果它不提供警报,我会感到非常惊讶,旧款 PERC6 卡肯定会提供,有时令人厌烦的程度。如果 VMware(或其他任何人)能够提供一份明确的列表,列出其内置硬件健康监控实际上可以为每个设备提供什么级别的故障报告,那就太好了,但这是我从来没能找到的东西。
如果 ESXi 支持 SNMP,那么这将更容易弄清楚,但不幸的是,它不支持,您必须使用 WBEM\CIM,而启用和交互并不容易。我在回答中引用的 Nagios\Python 脚本这个相关问题如果你能让它工作的话,可能会给你一些更好的信息。
戴尔有一份相当有用的文档了解您可以采取哪些步骤来通过 ESX & ESXi V4\4.1 上的 Open Manage Server Administrator 代理启用更高级的监控,如果您想在 ESXi 主机上完全启用远程监控,您可以按照这些步骤进行操作。即使这样,您也只能使用 CIM\WBEM 和 SNMP 陷阱,SNMP 查询在 ESXi 上不起作用。
答案2
您可以在 ESX 主机上安装 OpenManage Server Administrator,并使用它来监视系统并在驱动器出现故障时向您发出警报。
这里有一个安装指南:http://support.dell.com/support/edocs/software/smsom/6.2/en/omsa_ig/html/instesxi.htm#wp10982链接文本85
答案3
在以下答案中有一个非常相似的问题在 VMWare ESXi 上监控硬件 RAID
答案4
您可以从 vSphere API 本身获取有关 RAID 存储的一些信息。尝试使用 vSphere API,但只能从 RAID 设备检索到有限的信息。