有任何用于管理数据中心、事件、SLA 的软件吗?

有任何用于管理数据中心、事件、SLA 的软件吗?

我一直在寻找使用 OTRS - ITSM 来管理我们的所有服务,但想知道是否存在未内置于票务系统的软件?

几乎想要添加所有服务并将它们绑定到 SLA。完成后,我们将手动声明事件,系统会自动将我们的通知发送到适当的电子邮件列表,以进行停机/计划维护。

如果它能计算 SLA 等的报告就好了。

答案1

一开始我并不想回答,因为我没有推荐什么特定的软件包。然而,没有回复并不能公正地回答这个问题。

我倾向于创建或定制工具来满足特定的需求。

目前,我使用多种工具。具体到服务水平协议 (SLA):

我目前的 SLA 侧重于关键服务的生产正常运行时间。这三个类别分别是关键、主要和次要。关键是影响收入,主要是影响内部生产/不影响收入,次要是其他一切。我们根据关键服务制定 SLA 报告。

跟踪此指标的主要方法是我们在用于跟踪系统和网络变化的 Web 应用程序中开发的功能。如果对任何内容进行了更改,则会将其记录到此系统中。它本质上是一个花哨的 MOTD,旨在简单、快速和轻松。

如果发生中断,日志条目会记录服务级别、中断时长、服务类型以及中断原因。如果是外部中断,我们会记录,但不会计入内部指标。计划变更会被识别,但不会根据 SLA 进行报告。报告和图表以此为基础。复选框会将中断通知通过电子邮件发送到电子邮件列表,该列表用于发送中断前后的通知。

对此的额外补充是基于可用性和响应时间的外部监控,我目前使用的是网站脉搏以及外部服务器上的脚本。

我强烈建议您考虑创建和/或定制工具以满足您的确切需求。这是一种非常有用的方法。您可能还会发现请求追踪很有用,我曾用它进行访问和变更控制,以及普通的票务系统。它具有高度可定制性,因此您可以用它来进行 SLA 报告。

相关内容