我们有 2 个节点的集群 (Windows Server 2012),具有文件服务器角色。集群下配置了具有多个共享磁盘的资源组。由于其中一个磁盘出现文件系统错误,我们想用新磁盘 (现有磁盘的 LUN 克隆) 替换它,我们已经将克隆的 LUN 呈现给服务器。执行此操作时出现以下问题:
- 我们从故障转移群集管理器中将现有的问题磁盘脱机
- 当我们从资源组中删除同一个磁盘时,所有其他健康的磁盘都会进入脱机模式并从集群组中删除。
我们已经从文件服务器角色属性检查了依赖关系,并且它与有问题的 LUN 没有依赖关系。
提前致谢。
答案1
我在这里看到了几个潜在的问题,让我尝试逐一解决它们:
由于其中一个磁盘出现文件系统错误,我们想用新磁盘(现有磁盘的 LUN 克隆)替换它,我们已经将克隆的 LUN 呈现给服务器
关于这一点有两点评论:
- 您应该将新磁盘呈现给所有集群节点,而不仅仅是一个。
- 看来您已在硬件/块级别克隆了磁盘。这显然会带来将文件系统问题克隆到新磁盘上的风险。遇到文件系统问题时,我强烈建议进行文件级备份,并将其还原到新磁盘,而不要依赖块级操作。我还建议您
chkdsk
在新磁盘上运行,但请注意,可能chkdsk
会消除文件以修复文件系统。
当我们从资源组中删除同一个磁盘时,所有其他健康磁盘将进入脱机模式并从集群组中删除
这可能是因为其他磁盘依赖于您刚刚脱机/移除的磁盘。这种情况非常罕见,只有当您使用挂载点时,磁盘才应该依赖于代表挂载点的磁盘。如果安装在驱动器号上,磁盘不应该有依赖关系。检查每个脱机磁盘的依赖关系报告。
如果您还有其他问题,请更新您的帖子(而不是评论),我会更新这个答案。
HTH,埃德温。