比较服务群中的错误日志,查找唯一错误

比较服务群中的错误日志,查找唯一错误

我正在寻找一个工具,可以列出要检查的服务器、文件的位置,然后它会返回这些服务器中最常见错误的列表(为了报告简洁,假设为 2 或 3 个服务器),并获取类似这样的报告

Server.A     Server.B     Server.C
--------     --------     --------
42 error.X   39 error.X   61 error.X
21 error.Y   7  error.Y   5  error.A
17 error.B   6  error.A   4  error.Y
4  error.A   2  error.R   3  error.S
3  error.R   1  error.S   1  error.R

当然,排除时间戳和其他错误详细信息,只查找常见子字符串并像这样列出它们。我可以查看表格并看到 error.B 是 Server.A 独有的,并得出结论 Server.A 出了问题。这样的事情已经存在了吗?这是我必须自己编写的代码吗?

我不一定在寻找这个特定的报告,只是在一组错误日志中查找唯一错误的功能。

答案1

听起来你需要事件关联。例如,请参阅免费的简单事件相关器

Splunk日志存储还可以提供您需要的一些日志分析和关联。Splunk 仅供非常有限的用途免费使用,而 logstash 是开源的。

无论选择哪条路线,您都应该研究集中式日志记录并在专用日志服务器上收集所有日志,以便于进行这种分析,而无需先连接到远程系统。

相关内容