我们正在使用 OpsView/Nagios 来监控我们的服务器。我们已将 SNMP 服务添加到所有服务器并通过 GPO 部署配置,但一台 win2k3 服务器似乎有问题;它经常崩溃。事件日志包含以下消息:
Event Type: Error
Event Source: Service Control Manager
Event Category: None
Event ID: 7034
Date: 6/11/2009
Time: 7:11:49 PM
User: N/A
Computer: HOSTNNAME
Description:
The SNMP Service service terminated unexpectedly. It has done this 2 time(s).
并且
Event Type: Error
Event Source: Application Error
Event Category: (100)
Event ID: 1000
Date: 6/11/2009
Time: 7:11:18 PM
User: N/A
Computer: HOSTNAME
Description:
Faulting application snmp.exe, version 5.2.3790.3959, faulting module ntdll.dll,
version 5.2.3790.3959, fault address 0x000417af.
现在,我可能会将其设置为永久地在崩溃时重新启动,但我认为最好修复此类问题。这是一个已知问题吗?如果不是,我应该怎么做才能诊断它?
答案1
我以前遇到过这种问题。检查 SNMP 代理扩展。戴尔和其他公司为 SNMP 服务添加了扩展,可能会因缺少 DLL 等而导致崩溃。
我写了博客关于它,那是Arcserve当时的罪魁祸首
将此配置单元与其他服务器进行比较:
HKLM\SYSTEM\CurrentControlSet\Services\SNMP\Parameters\ExtensionAgents
您还可以使用 Process Explorer 来跟踪 SNMP 服务行为。
答案2
我也遇到过类似的问题,Mathieu 的解决方案对我有帮助。在我的例子中,有一个注册表名称如下。
"aussnmp"="SOFTWARE\\Adaptec\\RAIDController\\AAC\\CurrentVersion"
删除此内容即可解决问题。
顺便说一句,这是在 DELL 硬件上的 Windows Server 2008 R2 企业版上。
答案3
我在 SoftLayer 的 SuperMicro 物理服务器上遇到了一些间歇性问题。我发现删除以下两个键似乎可以解决问题。
HKEY_LOCAL_MACHINE\SOFTWARE\Adaptec\RAIDController\AAC\CurrentVersion\aussnmp
HKEY_LOCAL_MACHINE\SOFTWARE\Adaptec\RAIDController\AAC\CurrentVersion\Pathname