VMWare - VM 无法启动 - 5(输入/输出错误) - 驱动器故障

VMWare - VM 无法启动 - 5(输入/输出错误) - 驱动器故障

基本信息:服务器有 4 个驱动器,其中 2 个是固态驱动器。其中一个固态驱动器似乎出现故障。运行 VMWare 5.0

我们尝试将虚拟机分布在多个磁盘上并使用 RAID,但我不确定是否设置不正确。我们试图确保如果其中一个磁盘发生故障,我们仍然可以正常使用。然而,它可能产生了相反的效果。这是启动错误:

Failed to start the virtual machine.
Module DiskEarly power on failed. 
Cannot open the disk '/vmfs/volumes/54d9758a-23d4381c-9118-40167e7bd317/atlassian.somedomain.com/atlassian.somedomain.com_9-000003.vmdk' 
or one of the snapshot disks it depends on. 
5 (Input/output error)

在虚拟机的属性下,我可以看到: 在设置中显示已禁用的驱动器

以下是通过 SSH 进入 VMWare 服务器时的驱动器: 显示可用驱动器列表

以下是HDD1的内容: HDD1 文件夹的内容

HDD2 的内容: HDD2 文件夹的内容

SSD1 的内容: SSD1 文件夹的内容

最后,当我查看 SSD1s 的 atlassian.somedomain.com.vmx 文件时,我可以看到:

VMX 文件的内容

请注意对 SSD2 (54d9758a-23d4381c-9118-40167e7bd317) 的引用,查找 atlassian.somedomain.com_9-000003.vmdk

奇怪的是,其他一些虚拟机没有同样的问题,即使它们确实在同一个故障驱动器上共享文件。

我不确定如何继续,在我犯“最终”错误之前,我想得到有关下一步的反馈。

我可以:

1)从虚拟机的硬件列表中删除受影响的硬盘: 删除驱动器

2) 修改 SSD1s 的 atlassian.somedomain.com.vmx 文件,改为指向版本 _8(而不是缺失的 9)

3)还有其他建议吗?

注意:您在图片中看到的紫色是我掩盖的实际域名。

编辑:请注意,我知道如果 _10、_11 都是相互依赖的,我最终可能会失去它们 - 因为我可能必须将它们全部移回 _8。如果需要,那就这样吧。我只需要尽可能地恢复。

答案1

将虚拟机文件分布在多个磁盘上可确保您无法启动虚拟机,除非所有磁盘在线。

在严肃的设置中,RAID 必不可少。如果您可以忍受较长的停机时间,那么良好的备份可以替代 RAID 设置,否则您需要两者兼备。还要确保 RAID 和备份正常工作。

使用可靠的 RAID 设置重建存储。从备份恢复。就是这样。

这些话可能比较刺耳,但这是事实,抱歉。

不过有一点提示:如果您需要尽可能多地恢复,并且有一个已安装的 VMFS 卷但 .vmdk 无法读取,您可以使用它dd conv=noerrors来解决读取错误并复制其中有一些“漏洞”的 vmdk。不要指望 VM 之后能正常工作,它只是为您提供了更多可用资源。

相关内容