我们最近遇到了一个光纤通道存储问题(看起来像是一根坏电缆),它影响了连接到同一存储虚拟化设备(IBM SVC 2145)的 2 个集群中的所有 360 台虚拟机。这些虚拟机的响应速度非常慢,根本无法使用,而且许多虚拟机在 Windows 事件日志中记录了 symmpi 错误。
VMware 的回答显而易见——“存储问题”——但我们的存储团队坚称他们的设备或分区没有问题。我想知道一条故障电缆如何有效地使两个独立集群中的所有虚拟机瘫痪。
有谁遇到过类似的问题,或能提供任何解释吗?
PS 所有主机均运行 vSphere update 1,补丁截至 2009 年 12 月。
编辑:连接到同一 SVD 的物理服务器显然不受影响。
答案1
我不相信电缆故障会导致损坏 - FC 数据报经过校验以防止此类问题 - 事实上,就其速度而言,FC 可能是最具弹性的传输协议之一。
答案2
您可能订阅了过多的链接。也许可以查看 FC 网络上的流量,它是否很拥挤?如果是这样,单个链接断开可能意味着磁盘 I/O 延迟较高。Vkernal 有一些很好的软件可用于定位 VMWare 集群内的瓶颈。它可以提供一些线索。希望这能有所帮助。