几天前,我的服务器上的磁盘开始出现较大的队列长度:
我最近更换了控制器电池,HP 配置实用程序显示电池坏了,但更换电池后没有任何变化。HP 配置实用程序现在显示一切正常,但队列仍然相同
我该怎么做才能消除这个问题?也许我应该更换控制器?
更新 1(gtapscott 的问题):
1)这是一个读取队列,我添加了一个单独的读取队列计数器,它与总队列长度相匹配。写入队列为空。2
)平均磁盘队列从 0 到几百不等,平均值约为 100-200。我不确定,但我觉得这个计数器的行为就像根本没有控制器缓存一样。3
)RAID-5 中有 10 个磁盘
更新2(ewwhite 的帖子):
是的,我在更换电池后重启了服务器
我的界面稍有不同,如下:
因此在 RAID 大规模上启用了缓存
更新 3:
问题出在其中一个 RAID 磁盘上,正如 ewwhite 所指出的那样
答案1
您提到您已安装 HP 阵列配置实用程序。希望您已安装其余的 HP 系统管理代理。更换阵列电池后您是否重新启动了?如果没有,这可能会有所帮助。您还可以查看阵列配置实用程序来检查阵列状态。您应该看到类似以下内容Accelerator: Enabled
:
或者...
答案2
检查以确保写入缓存已重新启用。当控制器检测到电池问题时,它很可能已自动禁用,但更换电池后可能未重新打开。
答案3
一些观察:
- 确定这是读取队列还是写入队列,将性能计数器分为读取队列和写入队列。如果是写入队列,则肯定与控制器有关,因为如果出现电池问题,其写入缓存将被禁用。
- 我注意到平均磁盘队列长度计数器也包括在内。它的最大值/最小值和平均值是多少?当前的磁盘队列计数器往往非常尖锐,并且不是一个好的指标。
- 这个阵列由多少个物理磁盘组成?经典的衡量标准是平均每个物理磁盘的磁盘队列应保持为 1-2 个。