RAID 中的 HDD 出现故障,但扫描正常?

RAID 中的 HDD 出现故障,但扫描正常?

我的 Linux RAID 中有一个硬盘故障(红灯闪烁)。我将其拔出,并在重新启动时被迫手动运行 fsck 并修复剩余文件系统中的一些错误。

我试图找出它失败的原因,然后将其插入我的 Windows PC。当我插入它时,我收到一条消息,要求在磁盘管理器中对其进行初始化。我打算使用 CrystalDiskInfo 或 HDTune 来获取 SMART 数据。它显示为绿色,但“报告的不可纠正错误”下的计数为 1。我决定格式化它以获取更多信息。我进行了完整格式化,不是很快,也没有出现任何错误。

然后我加载了 HDTune 并进行了全面扫描,但没有发现任何问题。我知道这个驱动器已经使用了很多小时,但我更感兴趣的是问题的根本原因。忽略小时数,为什么这个驱动器会在 RAID 中发生故障,但随后却运行正常?

经过这些扫描后,还有理由不将其送回服务吗?

在此处输入图片描述

答案1

SMART 数据包含大量难以解读的专有信息。SMART 数据的问题在于,除非有“标记”的内容,否则几乎不可能真正知道驱动器的真正情况。

驱动器故障并不一定意味着其 SMART 状态有故障。

最有可能的是,驱动器开始显示正在重新分配的坏扇区,这会导致 RAID 出现计时问题。或者,RAID 驱动程序检测到其他问题 - 如读取失败、写入失败或访问/寻道时间过长。

回答你的问题,不,驱动器不应该被信任,也不应该被送回服务。我亲眼见过这种行为很多次,每次我将驱动器送回服务时,几个月内它又被踢出。我不再这样做了。

忽略任何可能存在接线问题或 RAID/SATA 控制器问题的情况,驱动器被踢出是因为它存在问题。驱动器价格便宜,而且 RAID 经常用于生产系统,因此不值得冒丢失两个或更多驱动器和数据的风险。

相关内容