我尝试使用 hpacucli 9.20 监控 HP ProLiant DL380 G5 上的 RAID 状态。但是,它表现得相当奇怪。大多数情况下,它会返回:
root@SERVER:~# hpacucli ctrl all show
Error: No controllers detected.
但有时它确实能按预期发挥作用:
root@SERVER:~# hpacucli ctrl all show
Smart Array P800 in Slot 4 (sn: PXXXXXXXXX)
我进行了一些测试,发现当我在 20 分钟内每隔一秒执行一次命令(600 次执行)时,大约 90-95% 的时间都会失败。
有人知道吗?这种奇怪行为的原因是什么?
技术信息:
- 操作系统:Ubuntu Server 12.04 LTS 64位
- 内核:Linux xen 3.2.0-29-generic #46-Ubuntu SMP
- 智能阵列固件版本:7.24
- 控制器:HP Smart Array P800
- hpacucli 版本:9.20.9.0
答案1
如果您只是想监控 RAID 状态,那么hpacucli
单独执行健康检查并不是正确的方法。我也能理解它失败的原因。不过,我无法在我的 RHEL 和 CentOS 服务器上重复同样的行为。strace
在这种情况下可能是您的朋友,因为故障很容易重现。
您想使用hp-snmp-agents
和hp-health
包进行真正的持续监控(提供电子邮件和 SNMP 警报)。
Ubuntu 与 HP 服务器相比有点妥协,因为增值工具并不像 HP 服务器那样完善。企业操作系统。
请参阅我的笔记:HP Proliant 服务器和 Ubuntu 12.04 的磁盘/RAID 监控
看起来你需要一些由SDR 存储库详情见:http://communitylinux.org/node/446#comment-866