SCOM 规则 - NTFS - 延迟写入丢失

SCOM 规则 - NTFS - 延迟写入丢失

我刚刚安装了 SCOM,它正在监控我们安装的 Windows 服务器的一个子集。

有一条规则正在生成警报,这给我带来了一些麻烦:NTFS - 延迟写入丢失

这是由 VMware 和我们的备份解决方案引起的。所有被监控的机器都是在 ESXi 5.5 或 6 上运行的 VMware 虚拟机。它们由 Commvault 备份,后者生成静默快照并备份快照。在生成快照时,Windows 会生成这些事件,这些事件由 SCOM 跟踪。这似乎是一个已知问题,而 VMware 对此没有采取任何措施。请参见此处:VMware 站点

由于我无法对生成的警告采取任何措施,因此我宁愿在拍摄快照时抑制该规则。不幸的是,SCOM 中的覆盖似乎是二进制的;该规则要么启用,要么不启用。我不想禁用这样的规则,在任何其他情况下,延迟写入失败都可能是一件严重的事情。

查看服务器上的事件日志,警报似乎在几秒钟内出现不超过 10-15 次。是否可以将 SCOM 设置为不通知该规则,除非它出现超过X次以上时间长度?如果做不到这一点,是否可以设置为在备份窗口期间抑制该规则?

如有任何建议我将不胜感激:)

答案1

我认为使用“维护模式”是您的正确选择。SCOM 中的任何服务器都可以在特定时间段内切换到维护模式,并且它会暂停该服务器上的所有监控工作流。以下是如何在 SCOM 中管理它的链接:https://technet.microsoft.com/en-us/library/hh212870.aspx

如果您的备份是自动化工作流程的一部分,您可能需要使用 PS 命令将该机器转为维护模式。以下是有关 PS cmdlet 的更多详细信息:https://technet.microsoft.com/en-us/library/hh918505(v=sc.30).aspx

我希望它有帮助。

谢谢你,罗曼。

答案2

您可以禁用原始规则并建立新规则或监视器。

版本 1:不要以 windows 类为目标,而是使用逻辑磁盘类目标。备份运行时,将逻辑磁盘设置为维护模式。因此,只有逻辑磁盘的工作流会停止。(您可以使用任何其他类来实现这一点)

当有许多实例需要同时设置为维护模式时,您应该对它们进行分组并为该组设置维护。根据我的经验,使用 powershell 遍历实例并为它们设置维护模式真的很慢。

版本 2:使用事件关联规则或者监视器. 例如:仅在第一个事件发生后 5 分钟内没有再次出现相同事件时发出警报。

相关内容