服务器未正确关闭后出现集群共享卷错误

服务器未正确关闭后出现集群共享卷错误

我们有两台 IBM X240 服务器(称为服务器 A 和服务器 B)通过光纤 HBA 连接到 IBM 磁盘系统:V3700。

两台服务器都安装有 Windows 2012 R2。

我们已经实施了 VM 集群并且一切运行良好。

上周,由于我的服务器机房断电,这两台服务器瘫痪了。

启动服务器A后,出现以下错误:

Windows 无法启动,可能是由于最近的硬件或软件更改所致。文件:\windows\system32\drivers\msdsm.sys 状态:0xc0000017 信息:无法加载操作系统,因为缺少关键系统驱动器或包含错误。

使用Last Good Configuration之后,我们就可以登录系统并开启集群虚拟机了。

现在看来一切都很好。

于是我就去启动服务器B,用和服务器A同样的方法登录系统。

我发现由于集群共享卷错误,所有虚拟机都将关闭或运行错误。

请参阅下面从系统日志中捕获的一些错误。

事件 5142,由于错误“(1460)”,群集共享卷“Volume7”(“群集磁盘 10”)不再可从此群集节点访问。请排除此节点与存储设备的连接和网络连接故障。

事件 5120,群集共享卷“Volume3”(“Cluster Disk 4”)由于“(c00000be)”而进入暂停状态。所有 I/O 将暂时排队,直到重新建立到该卷的路径。

现在我们只能打开一台服务器并关闭另一台服务器,如果我打开两台服务器,错误将再次出现并且服务器将关闭。

有任何建议或需要我提供更多信息吗?

2015 年 5 月 28 日更新的信息:

我认为问题在于无法从被动(非协调器)节点访问 CSV 卷。

我也参考了下面的文档但它也不能解决我的问题:

https://support.microsoft.com/en-us/kb/2008795?wa=wsignin1.0

使用 cmdlet:get-clustershardvolumestate 打开两个节点或任何一个节点时,请参阅以下结果

*当打开两个节点时: 在此处输入图片描述

打开任何一个节点时: 在此处输入图片描述

我也升级了两个节点供应商的 DSM 驱动程序,但结果是一样的。

相关内容