我在一台 Ubuntu 机器上提供云服务 (SaaS),很快将面临服务级别协议 (SLA)。也就是说,我们必须了解我们可以提供什么级别的服务(可能是按日或按周),然后有可靠的可用性记录来证明特定时间范围内的服务级别。
目前,直接在提供服务的服务器上记录可用性就足够了。但是,我找不到可以记录服务可用性并“返回”每日、每月和每年可用性指数的解决方案。
这项任务(就我目前所想象的)非常简单:每 20 秒请求一次 HTTP/S 资源,检查内容中的关键字,创建日志文件条目,并(可选)计算可用性百分比并将其存储到表中。理想情况下,还可以定义一个核心时间(例如上午 9 点到下午 5 点)并计算此时间的单独百分比。
从技术上来说,这样的软件运行在服务服务器还是监控服务器上应该没什么区别(当然,这对于停机记录的准确性有影响)。
- 我已经使用 monit 进行服务器监控,但是日志文件似乎不适合从中计算可用性百分比。
- 我也考虑过一个只写入日志文件的简单脚本,但我认为至少有一些软件包可以更好地完成这项工作。
谢谢大家的想法。如果我完全错了,请告诉我。SLA 对我来说是新领域,我还没有超越网络上的介绍。
答案1
有针对此问题的云解决方案...
当然,老式的监控解决方案也会计算这些百分比。开放网络管理系统做得很好。
示例消息:
节点 General - ppro 上的所有服务均已停止。已创建新的中断记录,服务级别可用性计算将受到影响,直至此中断得到解决。