磁盘队列长度过大

磁盘队列长度过大

几天前,我的服务器上的磁盘开始出现较大的队列长度:

在此处输入图片描述

我最近更换了控制器电池,HP 配置实用程序显示电池坏了,但更换电池后没有任何变化。HP 配置实用程序现在显示一切正常,但队列仍然相同

我该怎么做才能消除这个问题?也许我应该更换控制器?

更新 1(gtapscott 的问题):
1)这是一个读取队列,我添加了一个单独的读取队列计数器,它与总队列长度相匹配。写入队列为空。2
)平均磁盘队列从 0 到几百不等,平均值约为 100-200。我不确定,但我觉得这个计数器的行为就像根本没有控制器缓存一样。3
)RAID-5 中有 10 个磁盘

更新2(ewwhite 的帖子):
是的,我在更换电池后重启了服务器

我的界面稍有不同,如下:
在此处输入图片描述
在此处输入图片描述
在此处输入图片描述
在此处输入图片描述

因此在 RAID 大规模上启用了缓存

更新 3
问题出在其中一个 RAID 磁盘上,正如 ewwhite 所指出的那样

答案1

您提到您已安装 HP 阵列配置实用程序。希望您已安装其余的 HP 系统管理代理。更换阵列电池后您是否重新启动了?如果没有,这可能会有所帮助。您还可以查看阵列配置实用程序来检查阵列状态。您应该看到类似以下内容Accelerator: Enabled

在此处输入图片描述

或者...

在此处输入图片描述

答案2

检查以确保写入缓存已重新启用。当控制器检测到电池问题时,它很可能已自动禁用,但更换电池后可能未重新打开。

答案3

一些观察:

  • 确定这是读取队列还是写入队列,将性能计数器分为读取队列和写入队列。如果是写入队列,则肯定与控制器有关,因为如果出现电池问题,其写入缓存将被禁用。
  • 我注意到平均磁盘队列长度计数器也包括在内。它的最大值/最小值和平均值是多少?当前的磁盘队列计数器往往非常尖锐,并且不是一个好的指标。
  • 这个阵列由多少个物理磁盘组成?经典的衡量标准是平均每个物理磁盘的磁盘队列应保持为 1-2 个。

相关内容