我在装有 Windows Server 2008 的 DELL 服务器上重新插入了 RAID 磁盘。驱动器状态指示灯在绿色和琥珀色灯之间切换,并且显示器显示以下消息:
There are offline or missing virtual drives with preserved cache.
Please check the cables and ensure that all drives are present.
Press any key to enter the configuration utility.
我按下一个键,PERC 6/I 集成 BIOS 配置实用程序显示该磁盘的 RAID 状态为脱机。
重新插入磁盘后,监视器显示以下消息:
Foreign configuration(s) found on adapter.
Press any key to continue or ‘C’ load the configuration utility,
or press ‘F’ to import foreign configuration(s) and continue.
在网上查了一番后,我不确定我应该选择导入还是清除。我搞不清楚导入是指将信息从阵列/系统导入到现在的外部磁盘,还是相反,即将信息从外部磁盘导入到实际上运行良好的阵列/系统。此外,清除是否是重建该磁盘之前必须做的事情,或者清除是否意味着清除系统以某种方式使其准备好将信息从外部磁盘导入到阵列/系统。我想在这里做出错误的选择可能会是致命的。
请帮助清除这一问题,告诉我们该选择什么以及为什么。
编辑:我在 dell.com 支持故障排除上找到了更多信息:
- 如果阵列正在工作,则清除外部数据;如果阵列处于离线状态,则导入外部数据。
在同一页面上,戴尔支持还表示:
经验法则
如果受影响的阵列当前可以运行且数据可访问,请清除外部配置。
如果受影响的阵列当前无法运行,请导入外部配置。
就我而言,Windows 无法启动,我只得到上面提到的文本,当按下一个键时会打开 PERC,它显示除外部磁盘外,其他磁盘均在线。
所以我需要知道这是如何定义的。我的数组是功能性的还是非功能性的,以及如何判断?
@JimNim,感谢您的详细回答。ESC在 PERC 菜单中按下 后,服务器告诉我使用Ctrl+ Alt+并重新启动。出现带有+Del的消息,我尝试使用该组合键。不知道我是否到达了您想要我到达的地方,因为显示器显示了前面提到的消息,按下按键后我回到了 PERC 菜单。假设这就是+会带我到达的地方。请帮助分析该怎么做,以及是否仍有希望让服务器启动并运行,或者您是否需要更多详细信息。CtrlRCtrlR
PERC 菜单显示以下内容:
性病管理主页:
- 控制器 0
- 磁盘组 0
- 虚拟磁盘
- 虚拟磁盘 0(红色)
- 虚拟磁盘 1(红色)
- 物理磁盘
- 空间分配
- 热备件
VD Mgmt 右侧,同时突出显示控制器 0:
外部配置当前控制器属性:
- DG 数量:1
- VD 数量:2
- PD 数量:6
VD Mgmt 右侧,同时突出显示磁盘组 0:
外部配置存在磁盘组 0 属性:
- VD 数量:2
- PD 数量:5
- 空间平均值:0.000MB
- 免费分段:0
- 专用 HS:0
VD Mgmt 右侧,同时突出显示虚拟磁盘 0:
外部配置存在虚拟磁盘 0 属性:
- RAID 级别: 5
- RAID 状态:脱机
- 尺寸:97.656GB
- 操作:无
VD Mgmt 右侧,同时突出显示虚拟磁盘 1:
外部配置当前虚拟磁盘 1 属性:
- RAID 级别: 5
- RAID 状态:脱机
- 尺寸:4.450TB
- 操作:无
PD管理主页:
- 00:希捷,在线
- 01:WD,在线
- 02:WD,在线
- 03:希捷,国外
- 04:希捷,失败
- 05:希捷,在线
答案1
欢迎来到 serverfault!根据您在“答案”帖子中提供的信息(您应该编辑问题以提供更多信息,而不是发布答案):
哦天哪。看起来您的磁盘出现故障,然后阵列出于某种原因弹出了另一个磁盘 - 鉴于发生的任何结果都是致命的,它要么在重建期间将其中一个“工作”驱动器弹出到热备用上(将您带到当前工作集中的两个故障/不可用磁盘),要么您没有热备用,弹出将您带到两个脱机磁盘。RAID5 中的两个磁盘脱机 = 突然死亡。
您可能可以和该阵列上的数据告别了——最好的情况是,由于数据无法从缓存刷新到磁盘,您的文件系统已经出现损坏。
无论如何,您的 raid 集“不起作用”(您的虚拟磁盘处于离线状态),因此根据您找到的戴尔的说明,您应该“导入”外部阵列并希望它将其重新添加到现有的 raid5 阵列中,而不会因不干净状态而造成太大损坏 - 但基本上您应该已经准备从头开始,因为控制器很有可能只会根据“导入的”“外部”磁盘创建一组额外的离线虚拟磁盘,其中除了一个驱动器之外的所有驱动器都丢失。
如果奇迹般地它工作正常,你应该做广泛的检查,以确保这台服务器上可读/功能所需的一切实际上都是可读/功能的 - 或者更好的是,计划重新安装它,因为在这种故障之后,卷上数据的完整性受到严重怀疑。
您没有提及是否知道其中一个驱动器已经出现故障,因此作为后续操作,请确保已为所有 RAID 阵列配置监控,以尽量降低未来风险。
答案2
您有 2 个故障磁盘。RAID5 + 2 个故障磁盘 = 阵列故障。
您有两个选择:
- 将驱动器送到恢复公司,让他们恢复您的数据。您很可能恢复几乎所有(如果不是全部)数据。这可能会花费您 2500 美元,再加上新驱动器的费用,因为您不应该再使用旧驱动器。
- 继续修改您的配置,可能会面临彻底丢失所有数据的风险。
答案3
您需要在启动时使用 Ctrl+R 进入 PERC 适配器的配置屏幕。从那里,您应该能够看到有问题的驱动器是否是唯一处于“外部”状态的驱动器,以及 RAID 集是否降级/联机或发生故障。如果只有一个驱动器是外部的,您几乎肯定不想导入它;这可能是导致 RAID 集中的数据损坏的万无一失的方法,您至少必须进行一些文件系统修复,否则,重新安装操作系统并从备份中恢复数据。如果多个驱动器是外部的,并且 RAID 显示为失败,您应该尝试导入。这通常很有可能使 RAID 重新联机。清除通常只有在 RAID 只是降级/联机并且只有一个驱动器显示为外部时才是一个好主意 - 在这种情况下,您会清除,因为有问题的驱动器不再具有 RAID 集的准确最新数据,并且需要重建。如果导入不能解决问题,最后的选择就是“重新标记”,从头开始重新创建 RAID 集而不进行初始化。
如果您的系统仍在保修期内,我强烈建议您联系支持人员以获取更多帮助(不确定保修期外的支持对于此类问题有多大帮助)。