NAS 硬件可能出现故障,需要的解决方案

NAS 硬件可能出现故障,需要的解决方案

我有 8 个驱动器Rocketraid NAS其中一个“机箱”似乎有问题。尽管所有 8 个驱动器都位于同一设备中,但软件显然将顶部 4 个驱动器归类为一个“机箱”,将底部 4 个驱动器归类为另一个,这可能是因为每组 4 个驱动器都有自己的 esata 电缆(因为 NAS 通过 2 个 esata 电缆连接到 pci 卡)。我有 5 个驱动器(在 Raid 5 中),品牌和型号相同,我认为这是一个有趣的巧合,一个驱动器在自己的机箱中发生故障,现在已经更换了它,结果发现这个新驱动器也“发生故障”。

奇怪的是智能数据似乎没问题

ID  Name    Threshold   Worst   Value   Status
1   Read Error Rate 51  253 100 OK
3   Spin-up Time    21  176 176 OK
4   Start/Stop Count    0   100 100 OK
5   Re-allocated Sector Count   140 200 200 OK
7   Seek Error Rate 0   200 200 OK
9   Power-on Hours Count    0   100 100 OK
a   Spin-up Retry Count 0   253 100 OK
b   Drive Calibration Retry Count   0   253 100 OK
c   Drive Power Cycle Count 0   100 100 OK
c0  Power-Off Retract Count 0   200 200 OK
c1  Emergency Retract Cycle Ct  0   200 200 OK
c4  Relocation Event Count  0   200 200 OK
c5  Current Pending Sector Count    0   200 200 OK
c6  Off-line Scan Uncorrectable Sector Count    0   253 100 OK
c7  Ultra ATA CRC Error Rate    0   199 200 OK
c8  Multi-zone Error Rate   0   253 100 OK

我不太清楚如何读取这些信息,但它们都显示“OK”。设备被拾起并正常使用,这又很奇怪,但重建进行到大约 5-15% 时,重建失败并给出驱动器故障的事件日志。

我的问题是:

  • 我这么说对吗?因为智能数据读取全部“OK”,所以问题一定是出在外壳上而不是驱动器上?
  • 无需购买新硬件我可以尝试哪些修复?
  • 如果我购买了新硬件,我应该只更换 pci raid 卡吗?还是只更换装有驱动器的设备?我该如何找出问题的根源?
  • 如果我用不同品牌的硬盘替换其中一个或两个,raid 5 中的所有数据都会丢失吗?或者我是否可以将驱动器插入新设备并让其保持当前 raid5 和数据完好无损?

编辑:为了回答 Dave 的问题,我最初的设置是 5 个三星绿色硬盘,后来我意识到这并不推荐。它造成了一些卡顿问题,但 NAS 运行良好,持续了 3 年,直到其中一个硬盘“发生故障”,但在启动时仍能正常检测到,具有良好的智能信息,并且可以正常启动重建,但在完成重建之前失败。我得到的最新硬盘是 WD Red 硬盘,因为那是 NAS 硬盘。这次我确实尝试研究实际推荐的硬盘,但 RAID 卡制造商的推荐列表中没有当前可用的硬盘,所以我不得不即兴发挥。

我不知道制造商发布了自己的诊断软件,虽然 WD 似乎有一些,但似乎没有适用于其 WD Red 驱动器的软件。对于我的原装三星驱动器,我找到了一些希捷诊断软件(没想到三星和希捷已经合并了),我将尝试一下。

我假设所有驱动器上的固件在发生故障之前都是匹配的,因为我同时订购了所有 5 个驱动器,并且型号相同。现在我有点混搭,因为我想迁移到 NAS 驱动器,但不想花钱更换它们。

相关内容