基本信息:服务器有 4 个驱动器,其中 2 个是固态驱动器。其中一个固态驱动器似乎出现故障。运行 VMWare 5.0
我们尝试将虚拟机分布在多个磁盘上并使用 RAID,但我不确定是否设置不正确。我们试图确保如果其中一个磁盘发生故障,我们仍然可以正常使用。然而,它可能产生了相反的效果。这是启动错误:
Failed to start the virtual machine.
Module DiskEarly power on failed.
Cannot open the disk '/vmfs/volumes/54d9758a-23d4381c-9118-40167e7bd317/atlassian.somedomain.com/atlassian.somedomain.com_9-000003.vmdk'
or one of the snapshot disks it depends on.
5 (Input/output error)
在虚拟机的属性下,我可以看到: 在设置中显示已禁用的驱动器
以下是通过 SSH 进入 VMWare 服务器时的驱动器: 显示可用驱动器列表
以下是HDD1的内容: HDD1 文件夹的内容
HDD2 的内容: HDD2 文件夹的内容
SSD1 的内容: SSD1 文件夹的内容
最后,当我查看 SSD1s 的 atlassian.somedomain.com.vmx 文件时,我可以看到:
请注意对 SSD2 (54d9758a-23d4381c-9118-40167e7bd317) 的引用,查找 atlassian.somedomain.com_9-000003.vmdk
奇怪的是,其他一些虚拟机没有同样的问题,即使它们确实在同一个故障驱动器上共享文件。
我不确定如何继续,在我犯“最终”错误之前,我想得到有关下一步的反馈。
我可以:
1)从虚拟机的硬件列表中删除受影响的硬盘: 删除驱动器
2) 修改 SSD1s 的 atlassian.somedomain.com.vmx 文件,改为指向版本 _8(而不是缺失的 9)
3)还有其他建议吗?
注意:您在图片中看到的紫色是我掩盖的实际域名。
编辑:请注意,我知道如果 _10、_11 都是相互依赖的,我最终可能会失去它们 - 因为我可能必须将它们全部移回 _8。如果需要,那就这样吧。我只需要尽可能地恢复。
答案1
将虚拟机文件分布在多个磁盘上可确保您无法启动虚拟机,除非所有磁盘在线。
在严肃的设置中,RAID 必不可少。如果您可以忍受较长的停机时间,那么良好的备份可以替代 RAID 设置,否则您需要两者兼备。还要确保 RAID 和备份正常工作。
使用可靠的 RAID 设置重建存储。从备份恢复。就是这样。
这些话可能比较刺耳,但这是事实,抱歉。
不过有一点提示:如果您需要尽可能多地恢复,并且有一个已安装的 VMFS 卷但 .vmdk 无法读取,您可以使用它dd conv=noerrors
来解决读取错误并复制其中有一些“漏洞”的 vmdk。不要指望 VM 之后能正常工作,它只是为您提供了更多可用资源。