我今天与一位同事进行了讨论,我提到了如何不以手动方式主动监控服务器(即,通过 rdp 连接到随机服务器,并进行一些手动检查 - 这将与适当的自动监控相结合,但我们也没有这样做)。
作为系统和服务器管理的最佳实践 - 您是否建议每天结合自动监控手动检查服务器?
答案1
作为系统和服务器管理的最佳实践 - 您是否建议每天结合自动监控手动检查服务器?
简而言之,不是的。
您的监控系统必须足够全面,以监控每个系统提供的每个关键服务。
为什么?手动监控很简单才不是规模。如果你有 5 台服务器,这是一回事,但当你将其扩展到 50 台或 500 台时,你该怎么办?你不想付钱让系统管理员每天检查和查看一大堆服务器。
答案2
我绝对不会建议这样做——除非作为一项练习来确定你的自动监控在哪些方面存在不足。
为什么?很简单——人们会感到无聊,会忘记事情。机器不会。因此,如果您手动检查某些内容以确保服务器正常运行,请编写一个脚本来执行相同的操作,并让服务器定期调用它。
答案3
如果您的软件监控解决方案运行良好,我认为没有必要进行“抽查”。话虽如此,我每天至少绕着我们的数据中心走一圈,看看是否有监视器可能错过的琥珀色灯闪烁。如果您是托管公司,这可能不可行。对我来说,这只需要我每天花 5 分钟左右的时间。
答案4
我也不太明白手动检查有什么意义。手动检查不具可扩展性,而且看起来也很麻烦。
不过,我认为非常重要的一点是思考到底要监控什么。比如,没有必要监控机器上的每一项服务——这只会浪费流量并毫无意义地增加负载。只关注重要的东西。磁盘、RAID、一两个重要的服务,最重要的是日志文件。我倾向于认为,做好日志文件审计优化可以为你节省大量的工作和时间