我正在进行服务器维护,我升级了 1 个节点的 BIOS 和 Windows 更新,现在我正尝试将我们的数据库集群故障转移到被动的更新节点。故障转移很顺利,但 8 个数据库中有两个最终“可疑”。
这可能是由于 Windows 更新或 BIOS 更新造成的吗?
编辑:我正在使用集群管理员的集群移动组命令。
当我将其移回时,可疑部分消失,一切正常。问题只出现在一个节点上。
答案1
听起来您有一个连接到集群上未设置的驱动器的数据库,或者依赖项设置不正确。这将导致 SQL Server 在磁盘准备就绪之前启动,从而导致数据库出现问题。
检查 ERRORLOG 并查看数据库变得可疑的原因是什么。
答案2
一切皆有可能,但我更倾向于先检查硬盘(或 RAID)是否存在问题。
问自己以下问题:
您的环境中最近还发生了哪些其他变化(这可能是更可能的原因)?
查看 SQL Server 日志,看看是否可以确定错误发生的时间。这是否与您的 BIOS 更新和 Windows 更新理论相对应?
与您的团队成员交谈,询问他们何时做出了哪些更改。
查看您环境中的任何其他服务器上是否也出现此问题。
答案3
您如何进行故障转移?我希望您使用 CLUSTER GROUP /MOVE 命令,或者至少通过 MMC - MOVE GROUP。
在谈论集群时,我不喜欢看到“故障转移”这个词。
答案4
我猜测 (双关语) 存在问题的数据库具有共享存储驱动器,而这些驱动器在操作系统级别上无法被 Windows 正确看到。
检查故障转移时是否可以导航到共享驱动器并找到这些数据库的 mdf 和 ldf 文件,如果不能,则应从集群中删除该节点并重新初始化服务器上的共享驱动器。