我有一台家庭服务器,其规格如下:
- 联想TS140服务器
- IBM ServeRAID M5015 RAID 控制器
- 4 个 WD Red 4TB 硬盘(WD40EFRX),RAID 10
- 3WARE SFF-8087 电缆 (CBL-SFF8087OCF-05M) 将驱动器连接到 RAID 控制器
最近我的一个驱动器出现故障(使用约 8 个月后),因此我对其进行了 RMA,收到了替换驱动器并成功重建了阵列。24 小时后,控制器报告替换驱动器出现故障,因此我提交了另一个 RMA。我刚刚收到了新的替换驱动器,当我插入驱动器或尝试重建阵列时,控制器的警报响起并显示新的替换驱动器出现故障。
奇怪的是,如果我将驱动器从服务器中取出并放入台式计算机中,我可以格式化并使用该驱动器,没有任何问题。运行可以读取 SMART 数据 (CrystalDiskInfo) 的程序时,驱动器显示为“良好”状态。
不幸的是,我对 RAID 没有太多经验,所以我不完全确定这里的问题是什么。我是否应该尝试将驱动器送回去进行另一次 RMA?可能是 SFF-8087 电缆出现故障?或者我还能做些什么来更深入地了解可能导致此问题的原因?
以下是显示驱动器 SMART 数据的屏幕截图:
我还在 PassMark DiskCheckup 和 Western Digital Data LifeGuard Diagnostics 中运行了磁盘自检(简短和扩展)。所有测试均通过:
答案1
不同的控制器对于驱动器是否足够健康有不同的标准。有些控制器甚至拒绝获取新驱动器,除非您重建整个阵列。
跑步WD Data Lifeguard 诊断并查看驱动器是否通过了快速测试和扩展测试。您甚至可以对所有驱动器执行此操作。这应该会显示驱动器是否健康。您还可以尝试使用该工具将新的替换 WD Red 填充为零(全填充),看看这是否解决了控制器的问题。
检查 SMART 状态的原始值,因为它们可以为您提供有关驱动器状况的更精确的信息。
您可以发布您所进行的测试的截图吗?