我们有两台 IBM X240 服务器(称为服务器 A 和服务器 B)通过光纤 HBA 连接到 IBM 磁盘系统:V3700。
两台服务器都安装有 Windows 2012 R2。
我们已经实施了 VM 集群并且一切运行良好。
上周,由于我的服务器机房断电,这两台服务器瘫痪了。
启动服务器A后,出现以下错误:
Windows 无法启动,可能是由于最近的硬件或软件更改所致。文件:\windows\system32\drivers\msdsm.sys 状态:0xc0000017 信息:无法加载操作系统,因为缺少关键系统驱动器或包含错误。
使用Last Good Configuration之后,我们就可以登录系统并开启集群虚拟机了。
现在看来一切都很好。
于是我就去启动服务器B,用和服务器A同样的方法登录系统。
我发现由于集群共享卷错误,所有虚拟机都将关闭或运行错误。
请参阅下面从系统日志中捕获的一些错误。
事件 5142,由于错误“(1460)”,群集共享卷“Volume7”(“群集磁盘 10”)不再可从此群集节点访问。请排除此节点与存储设备的连接和网络连接故障。
事件 5120,群集共享卷“Volume3”(“Cluster Disk 4”)由于“(c00000be)”而进入暂停状态。所有 I/O 将暂时排队,直到重新建立到该卷的路径。
现在我们只能打开一台服务器并关闭另一台服务器,如果我打开两台服务器,错误将再次出现并且服务器将关闭。
有任何建议或需要我提供更多信息吗?
2015 年 5 月 28 日更新的信息:
我认为问题在于无法从被动(非协调器)节点访问 CSV 卷。
我也参考了下面的文档但它也不能解决我的问题:
https://support.microsoft.com/en-us/kb/2008795?wa=wsignin1.0
使用 cmdlet:get-clustershardvolumestate 打开两个节点或任何一个节点时,请参阅以下结果
*当打开两个节点时:
打开任何一个节点时:
我也升级了两个节点供应商的 DSM 驱动程序,但结果是一样的。