可能重复:
HP-SNMP-Agents 的系统负载很高
收到我们的 HP ProLiant DL360 后,我想将该机器集成到我们的 Munin 系统中,从而能够通过 SNMP 显示 ProLiant 特定信息。
我正在运行内核为 2.6.26-2-vserver-amd64 的 Debian Lenny 。我已关注http://downloads.linux.hp.com/SDR/getting_started.html并且 HP 存储库已添加到/etc/apt/sources.list.d/HP-ProLiantSupportPack.list
。
设置 Lenny SNMP 本身不是问题,我将其配置为具有公共 v1 社区字符串以读取所有数据,并且它可以正常工作。我安装hp-snmp-agents
并运行hpsnmpconfig
,它会在顶部添加额外的行/etc/snmp/snmpd.conf
:
dlmod cmaX /usr/lib64/libcmaX64.so
snmpd 重新启动。
通过它lsof
,我可以看到libcmaX64
已加载并由 snmpd 使用,但我没有从 snmp 获得任何其他信息。我使用snmpwalk -v 1 -c public ...
并可以看到许多 OID,但我没有看到我期望的新 OID,最明显的是温度、风扇速度等。
我期望的 OID 是例如1.3.6.1.4.1.232.6.2.6.8.1.4.
1,这是来自现有的 munin 插件http://exchange.munin-monitoring.org/plugins/snmp__hp_temp/version/1。
snmpd[19007]: cmaX: Parsing shared as a type was unsucessful
snmpd[19007]: cmaX: listening for subagents on port 25375
snmpd[19007]: cmaX: subMIB 1 handler has disconnected
snmpd[19007]: cmaX: subMIB 2 handler has disconnected
snmpd[19007]: cmaX: subMIB 3 handler has disconnected
snmpd[19007]: cmaX: subMIB 5 handler has disconnected
snmpd[19007]: cmaX: subMIB 6 handler has disconnected
snmpd[19007]: cmaX: subMIB 8 handler has disconnected
snmpd[19007]: cmaX: subMIB 9 handler has disconnected
snmpd[19007]: cmaX: sent ColdStarts on ports 25376 to 25393
snmpd[19007]: cmaX: subMIB 10 handler has disconnected
snmpd[19007]: cmaX: subMIB 11 handler has disconnected
snmpd[19007]: cmaX: subMIB 14 handler has disconnected
snmpd[19007]: cmaX: subMIB 15 handler has disconnected
snmpd[19007]: cmaX: subMIB 16 handler has disconnected
snmpd[19007]: cmaX: subMIB 21 handler has disconnected
snmpd[19007]: cmaX: subMIB 22 handler has disconnected
snmpd[19007]: cmaX: subMIB 23 handler has disconnected
snmpd[19007]: cmaX: subMIB 1 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 2 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 3 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 5 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 6 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 8 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 9 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 10 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 11 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 14 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 15 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 16 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 21 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 22 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 23 will be sent on port 25376 to hp Advanced Server Management_Peer
snmpd[19007]: cmaX: subMIB 18 handler has disconnected
snmpd[19007]: cmaX: subMIB 18 will be sent on port 25393 to cpqnicd
snmpd[19007]: NET-SNMP version 5.4.1
对我来说这看起来并不是特别糟糕,我猜这只是提供信息而已。
我比较了有模块和没有模块时的步行 OID 输出,返回的 OID 没有任何区别。我还遗漏了其他先决条件吗?
我还注意到,从我安装 hp-snmp-agents 开始,它添加了很多额外的守护进程,我的负载突然跳到 1。我暂时卸载了该软件包。这是预期行为吗?
负载峰值 http://h30499.www3.hp.com/hpeb/attachments/hpeb/bsc-431/18582/1/load.jpg
答案1
我遇到了同样的情况,启动代理后,我的负载也保持在 1。我在这个线程中找到了解决方案,可以将负载降低到至少 0.6:
还要确保不同选项的社区字符串不同。否则,您将不断看到“子容器错误”消息/var/log/net-snmpd.log
更新:在找到您的问题之前,我曾问过同样的问题(只是标题完全不同);HP-SNMP-Agents 的系统负载很高你会在那里找到答案。引用:
简而言之,您需要使用 /etc/init.d/hp-snmp-agents stop 停止 HP 管理代理。编辑 /opt/hp/hp-snmp-agents/cma.conf 中的排除行:
排除
到
排除 cmasm2d cpqriisd cmarackd
使用 /etc/init.d/hp-snmp-agents start 重新启动代理