上周末,我不得不更换 PERC/5i 控制器上的 RAID 1 中的一个硬盘,因为它报告失败。
更换光盘后,它可以工作 5 天,然后控制器开始抱怨新光盘:
# megaclisas-status
-- Controller informations --
-- ID | Model
c0 | PERC 5/i Adapter
-- Arrays informations --
-- ID | Type | Size | Status | InProgress
c0u0 | RAID1 | 465G | Degraded | None
-- Disks informations
-- ID | Model | Status
c0u0p0 | WD-WMAYP4753240WDC WD5003ABYX-01WERA1 01.01S02 | Failed
c0u0p1 | S13TJ1KQ503997 SAMSUNG HD502IJ 1AA01110 | Online, Spun Up
There is at least one disk/array in a NOT OPTIMAL state.
所以现在我对控制器有点怀疑,很难相信这么新的光盘在这么短的正常运行时间后就会出现故障,还是真的如此?我该怎么做才能诊断问题的根源?有没有办法重置控制器认为光盘所处的状态?
答案1
如果多个驱动器在同一个插槽中持续出现故障,则最有可能是它们所连接的背板出现故障,或者可能是该特定插槽的插座出现物理故障。您可以使用背板上的其他插槽吗?
请注意,问题仍然可能是硬盘——如果存储或运输不当,即使是全新的,也会出现故障。
即使可以通过“重置”控制器的状态来清除此错误,但为什么在不确定是否已消除问题根源的情况下要这样做呢?使用镜像的全部意义在于,您可以相信 RAID 成员将保持一致,并且您有证据表明这种情况不太可能发生。
答案2
我遇到过类似的问题,最后只能更换连接 RAID 卡和驱动器托架的 SCSI 电缆。我更换了卡,但问题没有解决。看看电缆。HTH