我的主要工作机器上有一个运行 Windows 10 的 3TB 软件 RAID 卷,物理上是两个 3TB 旋转锈盘。启动卷是一个单独的 NVMe SSD。例如断电后,RAID 卷重新同步过程需要 5 小时不间断的运行时间。
刚刚做了一个简单的实验:
- 重启、登录、检查卷是否同步、有序关闭电源。根据过去的经验,如果此时我重启、登录、检查卷状态,我会发现 RAID 已同步。
- 断开两个 3TB 硬盘的电源,重新启动,登录,然后有序关机。
- 将两个 3TB 硬盘的电源重新连接,重新启动,登录,检查卷状态。
RAID 重新同步过程已启动。我认为,看到两个驱动器断开连接这一事实本身就记录在 NVMe 驱动器上的 Windows 启动卷上,足以触发重新同步。
我该如何避免这种情况?我希望在重新连接驱动器之前做一些事情,但我愿意在断开驱动器之前做一些事情。
原始动机和报告:
有时我想用那台我知道很可能会崩溃的 PC 做一些事情。昨天,我正在清理朋友的 M.2 SSD,结果发现它已经长出了坏块,导致 BIOS 警告,并以某种方式阻止 Windows 启动,包括从另一个卷启动。所以我
- 确认我的 RAID 卷已同步,然后关闭我的机器
- 断开了两个旋转锈驱动器的电源连接器,将有故障的 M.2 连接到辅助端口
- 尝试从主端口上的 NVMe 启动 Windows;光标旋转了大约 15 分钟
- 连接 Linux USB 密钥,重置,启动,从故障的 M.2 SSD 中提取关键数据
- 关闭电源,移除故障的 M.2 SSD,重新连接电源连接器
- 从 NVMe 重新启动 Windows。
令我沮丧的是,RAID 重新同步过程开始了。
答案1
我假设 RAID 驱动器在此过程中没有看到任何变化,但您甚至可以在离线时断开阵列中的驱动器,例如进行非易失性表面扫描。如果重建过程启动,则其中一个(或甚至两个)驱动器上发生了一些变化(这可能表明健康状况恶化)。
您可能希望对每个驱动器进行扫描,以查看它们是否仍然健康。我不确定您运行的是软件 RAID 还是硬件 RAID,但最安全的方法可能是关闭电源,然后使用可启动工具分别对每个驱动器进行表面扫描(只读!)。硬件 RAID 意味着您必须切换端口或在卡的 BIOS 上将 RAID 更改为 JBOD 设置。
从长远来看,我强烈建议放弃 RAID。正如您所注意到的,重建过程需要的时间越来越长(我认为上次我在 Areca RAID 卡上使用 4TB 驱动器时大约需要 36 小时)。在此期间,另一个驱动器也可能会失败,因为您可能同时购买了这两个驱动器,并且它们的磨损程度完全相同。
答案2
使用 Windows Server 目录验证 SSD 是否已通过 Windows Server 2016 和 Windows Server 2019 认证询问供应商驱动器是否与存储空间直通兼容使用存储管理软件检查存储上驱动器的状态。使用存储管理软件检查存储上驱动器的状态。确保所有节点都安装了最新的 Windows 更新。如有必要,请更新存储和驱动器固件。