我有一台 Dell Poweredge R630,带有 4 个驱动器,组成 RAID。我不确定它是 RAID 10 还是 RAID 5,因为我最初没有订购或设置服务器,而且我只是默认网络管理员,这不是我的主要工作。该服务器正在运行 vSphere Essentials ESXi 6.7,并托管六个虚拟机。
我使用在另一台主机上的虚拟机中运行的 Altaro VM 备份来备份此主机以及 ESXi 6.5 主机。当我开始备份此主机上的虚拟机时,我发现备份会随机失败。任何特定晚上,我备份的 5 台虚拟机中的 2 台或 3 台都会失败,但每晚不会发生相同的虚拟机。几周前,它们开始总是失败。
在与 Altaro 支持人员合作查找失败原因时,他们在 Altaro 日志中发现了这一点:
2019/09/24 00:11:31.034: DISKLIB-LINK : "san://snapshot-155[Storage] VMName/[email protected]:[email protected]/XXX" : failed to open (Unknown error).
2019/09/24 00:11:31.034: DISKLIB-CHAIN : "san://snapshot-155[Storage] VMName/[email protected]:[email protected]/XXX" : failed to open (Unknown error).
2019/09/24 00:13:18.446: VixDiskLib: Detected DiskLib error 2338 (NBD_ERR_NETWORK_CONNECT).
2019/09/24 00:13:18.446: VixDiskLib: VixDiskLib_Read: Read 437 sectors at 19619760 failed. Error 14009 (The server refused connection) (DiskLib error 2338: NBD_ERR_NETWORK_CONNECT) at 5235.
他们的支持人员说这些日志条目(特别是最后一行)直接来自主机。
我不是 ESXi 专家,因此我不太清楚应该查看 ESXi 中的哪些日志文件,以便找出问题所在,确认是主机上的驱动器问题,并确定是哪个驱动器,以便更换它。到目前为止,vCenter 尚未发出有关驱动器问题的任何警报或警告,主机也未指示阵列存在问题。
另一个数据点:大多数虚拟机都运行 Windows。每个虚拟机都在内部将 Windows 备份到单独的驱动器,并且所有备份都完成且没有错误。我发现有趣的是,Windows 能够从虚拟机内部备份其驱动器,但当 ESXi 从外部进行备份时会出现读取错误。
答案1
这不是主机硬盘的问题。日志文件告诉你由于网络错误,无法打开虚拟机的虚拟硬盘。
我猜想与 Altaro 备份位于同一主机上的虚拟机备份可能不会失败。对吗?