我们最近接手的一位客户上周遭遇了灾难性的故障,原因(似乎是)硬盘故障,可能是电源故障造成的。(花点时间嘲笑他们没有最近的备份。这个问题与此无关。)
他们正在奔跑Windows 小型企业服务器 2003 R2 高级版,在配备 2GB RAM 的基于 Intel 的 Xeon 和两个 250GB Western Digital SATA 硬盘上RAID 1配置。
事实证明,RAID 配置了两个虚拟磁盘,即 OS 和数据。我们一意识到数据已损坏,就使用了安克诺斯 (Acronis) 真实影像对 RAID 集进行映像处理。
当我们意识到 Active Directory 无法修复(所有备份都太旧,毫无用处)时,我们决定重建该盒子,使用新电源和新驱动器。我们用两个 1TB SATA 驱动器替换它们,采用相同的 RAID 1 配置。Acronis 映像被放在新的 RAID 集上,以允许访问其旧数据。
现在到了有趣的部分。
一旦重建了盒子,配置了新的域,重新创建了所有用户帐户,并且旧的电子邮件合并从修复后的 EDB 文件中,我们注意到了一些非常奇怪的事情。任何文件、电子邮件和 SQL 数据库记录上的最新日期戳都是2010 年 8 月 28 日。
为了弄清楚到底发生了什么,我从 RAID 镜像中获取了一个原始驱动器,并注意到许多文件的日期都比较新,但数据无法修复。
所以我的问题是:RAID 镜像是否可能在 2010 年 8 月 28 日就真的失效了,而这次灾难性的故障只是巧合?如果单独从属,则没有实际机会从驱动器中恢复任何有用的东西,但作为 RAID 集,我们有 Acronis 映像可供使用,但最新的日期是 2010 年 8 月 28 日。
怎么回事?上个月的数据在哪里?如果有人能解释一下这个问题,我会很感兴趣。
答案1
我敢打赌你是对的,镜像自 8 月 28 日以来就已降级。无论是磁盘被撞松,控制器怀疑磁盘出现故障(SMART 数据/读取错误)还是其他原因,第二个磁盘当时都停止更新。系统继续运行,镜像处于降级状态(一个磁盘旋转,一个磁盘空闲),并且旋转的磁盘无法与故障电源匹配。