我如何实时监控 Scom Monitors?

我如何实时监控 Scom Monitors?

有一个 ”监察者规则“scom 用户可能知道这一点。如果您有由监视器生成的警报(而不是生成警报的规则),请不要关闭它,让它自行关闭。如果您关闭警报,您将不会再次收到有关该问题的通知,直到监视器恢复到健康状态,然后又回到不健康状态。

如果有人关闭磁盘空间警报(或者在维护期间发生,或者警报很旧并自动关闭),我们直到机器出现问题时才会发现服务器仍然存在空间问题。我想要一种方法来为处于不健康状态的监视器重新生成警报。

目前我已经研究了一个名为的 powershell 解决方案绿色机器但它似乎效果不太好,而且非常慢。

人们找到了哪些解决方案来解决这个问题?

答案1

一个更简单但影响更大的解决方案:将产生严重健康状态的对象置于维护模式 15 分钟。一旦退出维护模式,健康状态将变为“未监控”,并将重新评估。

这样,您将重新生成警报。但请记住,它对该对象上运行的监视器的每条规则都具有相同的效果。

答案2

虽然您可以使用 PowerShell 来构建一个可以重置监视器的监视数据的解决方案。即调用ResetMonitoringState监视对象的方法,如您提供的 GreenMachine 链接。如果在 Health Explorer 中或从 PowerShell 脚本重置监视器,则当监视器重新运行并检测到仍存在严重或警告状态时,如果前一个警报已关闭,则会生成新警报。

虽然 SCOM 有警报,但它是状态驱动的,而不是像 MOM 那样由警报驱动的。一些转换后的管理包仍然表现出警报驱动的特性。然而,在 SCOM 设计的管理包(如 Windows 平台的管理包)中,警报几乎总是来自监视器(状态观察器)。

这一变化最终意味着,监控方式需要更多地关注状态而不是警报。可以在状态视图(如 Windows 计算机等)或 Health Explorer 中查看状态。可以为特定情况创建新的状态视图。另请注意,创建监视器时可能不会针对每个警告或关键状态发出警报(这是可选的),并且可以覆盖。

我的建议是,您不要寻找重新生成警报的方法,而是改变组织中的监控方式。

相关内容