带有 Smart Array P410 的 ProLiant DL180 G6 逻辑驱动器出现故障(持续出现故障并需要重建)

带有 Smart Array P410 的 ProLiant DL180 G6 逻辑驱动器出现故障(持续出现故障并需要重建)

我遇到了一个问题,一堆 DL180 都配备了 P410 智能阵列和 2 个逻辑驱动器,一个用于根文件系统,另一个是 nfs 导出的大型 10TB 文件系统。

这些盒子主要是 nfs 服务器,经常达到最大容量并且成为处理链中的瓶颈。

这些 10TB 逻辑驱动器中的一个时不时就会出现故障并需要重建。这种情况大约每月发生一次,很麻烦。

消息为“消息:此逻辑驱动器已发生故障,无法使用。此逻辑驱动器上的所有数据已丢失。”

我们尝试更新磁盘阵列上的固件和内核模块,并使用各种版本的 Linux 作为主机操作系统,debian、CentOS,并尝试使用 xfs 和 ext3 作为文件系统类型。但是逻辑驱动器仍然需要定期从备份中重建。

我已附加其中一个故障驱动器的 hpacucli 诊断输出。 http://pastebin.com/9zTiuSAN

一些有趣的输出项;

插槽 1 中的智能阵列 P410:识别控制器 RAM 固件版本 2.00 ROM 固件版本 2.00

关于可能存在的问题,或者我该如何检测这些阵列/磁盘以了解导致驱动器故障的原因,您有什么建议吗?

# cat output.txt  | grep -B 2 'Drive Firmware Rev'
   Drive Model                          ATA     GB1000EAMYC     
   Drive Serial Number                  WMATV2509266        
   Drive Firmware Revision              HPG2    
--
   Drive Model                          ATA     GB1000EAMYC     
   Drive Serial Number                  WMATV1739564        
   Drive Firmware Revision              HPG2    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ456MN            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ45RS3            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ460P0            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ454YN            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ4664M            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ457M9            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ46Q9E            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ4630X            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ454PD            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          ATA     GB1000EAFJL     
   Drive Serial Number                  9QJ45Z0Y            
   Drive Firmware Revision              HPG8    
--
   Drive Model                          HP      DF0146B8052     
   Drive Serial Number                  3QN1KS7H00009949SQ4M
   Drive Firmware Revision              HPD5
--
   Drive Model                          HP      DF0146B8052     
   Drive Serial Number                  3QN1KNFS00009949UX4F
   Drive Firmware Revision              HPD5

答案1

我们遇到了类似的驱动器故障问题,HP KB 文章指出驱动器固件存在问题。更新固件应该可以解决这个问题。无法打开您的帖子以查看它是否列出了驱动程序固件版本。

答案2

这些磁盘是来自 HP 还是其他制造商的?

HP 磁盘可能具有特别定制的固件,如果您的磁盘不是运行此定制固件的 HP 磁盘,则 RAID 控制器可能会由于各种原因将它们从 RAID 阵列中删除。

如果是这种情况(非 HP 磁盘),我不确定您是否能找到明确的答案(或者不幸的是,解决方案),因为您无法可靠地预测磁盘在此 RAID 控制器中的运行方式,并且 HP 与此无关。

相关内容