昨天我们遇到了一件相当恼人的事件。
在例行快照备份期间,一台机器出现故障并出现以下错误:
Backup virtual machine
Cannot complete the operation. See the event log for details.
Incremental Forever - Incremental
其次是:
Create virtual machine snapshot
An error occurred while saving the snapshot: msg.snapshot.error-QUIESCINGERROR.
八小时后,下一次备份和快照启动并成功。
然而,机器本身完全没有响应,安装在其上的 SQL Server 出现 I/O 错误。
在接下来的 12 个小时内,机器本身每 30 秒就会出现以下警告:
Reset to device, \Device\RaidPort0, was issued.
SQL Server 尝试在数据库上执行任何查询时出现以下错误:
Time-out occurred while waiting for buffer latch type 2 for page
在 SQL 日志中我们可以发现以下错误:
SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file
我们最终尝试重新安装数据库,重新启动服务(SQL Server 和虚拟磁盘服务)。但最终唯一的解决方案是重新启动服务器。
VSphere Snapshot 过程中发生了什么可能导致此事件链?
如果这与 VSphere Snapshot 有关,为什么重新启动可以解决此问题?