虚拟机快照失败,随后服务器挂起

虚拟机快照失败,随后服务器挂起

昨天我们遇到了一件相当恼人的事件。
在例行快照备份期间,一台机器出现故障并出现以下错误:

Backup virtual machine
Cannot complete the operation. See the event log for details.
Incremental Forever - Incremental

其次是:

Create virtual machine snapshot
An error occurred while saving the snapshot: msg.snapshot.error-QUIESCINGERROR.

八小时后,下一次备份和快照启动并成功。
然而,机器本身完全没有响应,安装在其上的 SQL Server 出现 I/O 错误。

在接下来的 12 个小时内,机器本身每 30 秒就会出现以下警告:

Reset to device, \Device\RaidPort0, was issued.

SQL Server 尝试在数据库上执行任何查询时出现以下错误:

Time-out occurred while waiting for buffer latch type 2 for page

在 SQL 日志中我们可以发现以下错误:

SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file 

我们最终尝试重新安装数据库,重新启动服务(SQL Server 和虚拟磁盘服务)。但最终唯一的解决方案是重新启动服务器。

VSphere Snapshot 过程中发生了什么可能导致此事件链?
如果这与 VSphere Snapshot 有关,为什么重新启动可以解决此问题?

相关内容