我遇到了一个问题,一堆 DL180 都配备了 P410 智能阵列和 2 个逻辑驱动器,一个用于根文件系统,另一个是 nfs 导出的大型 10TB 文件系统。
这些盒子主要是 nfs 服务器,经常达到最大容量并且成为处理链中的瓶颈。
这些 10TB 逻辑驱动器中的一个时不时就会出现故障并需要重建。这种情况大约每月发生一次,很麻烦。
消息为“消息:此逻辑驱动器已发生故障,无法使用。此逻辑驱动器上的所有数据已丢失。”
我们尝试更新磁盘阵列上的固件和内核模块,并使用各种版本的 Linux 作为主机操作系统,debian、CentOS,并尝试使用 xfs 和 ext3 作为文件系统类型。但是逻辑驱动器仍然需要定期从备份中重建。
我已附加其中一个故障驱动器的 hpacucli 诊断输出。 http://pastebin.com/9zTiuSAN
一些有趣的输出项;
插槽 1 中的智能阵列 P410:识别控制器 RAM 固件版本 2.00 ROM 固件版本 2.00
关于可能存在的问题,或者我该如何检测这些阵列/磁盘以了解导致驱动器故障的原因,您有什么建议吗?
# cat output.txt | grep -B 2 'Drive Firmware Rev'
Drive Model ATA GB1000EAMYC
Drive Serial Number WMATV2509266
Drive Firmware Revision HPG2
--
Drive Model ATA GB1000EAMYC
Drive Serial Number WMATV1739564
Drive Firmware Revision HPG2
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ456MN
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ45RS3
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ460P0
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ454YN
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ4664M
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ457M9
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ46Q9E
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ4630X
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ454PD
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ45Z0Y
Drive Firmware Revision HPG8
--
Drive Model HP DF0146B8052
Drive Serial Number 3QN1KS7H00009949SQ4M
Drive Firmware Revision HPD5
--
Drive Model HP DF0146B8052
Drive Serial Number 3QN1KNFS00009949UX4F
Drive Firmware Revision HPD5
答案1
我们遇到了类似的驱动器故障问题,HP KB 文章指出驱动器固件存在问题。更新固件应该可以解决这个问题。无法打开您的帖子以查看它是否列出了驱动程序固件版本。
答案2
这些磁盘是来自 HP 还是其他制造商的?
HP 磁盘可能具有特别定制的固件,如果您的磁盘不是运行此定制固件的 HP 磁盘,则 RAID 控制器可能会由于各种原因将它们从 RAID 阵列中删除。
如果是这种情况(非 HP 磁盘),我不确定您是否能找到明确的答案(或者不幸的是,解决方案),因为您无法可靠地预测磁盘在此 RAID 控制器中的运行方式,并且 HP 与此无关。