我想监控 Tomcat 服务器上的请求处理延迟。稍后在此基础上执行一些警报会很好。我使用 %D 模式配置了 Tomcat 阀门,因此它将在访问日志文件中记录处理每个请求所需的时间。从这些日志行计算 50、90、99 百分位数的正确方法是什么?我已经为基本主机指标(cpu/mem、hdd)配置了 Prometheus 和 Grafana,但我不清楚如何正确计算百分位数并使用 prometheus/grafana 绘制它们?想法是检测应用程序故障并在它完全无响应之前做出反应。提前谢谢大家!
答案1
你可以用我的tomcat_导出器通过配置响应时间指标的过滤器来实现这一点。或者,您也可以自己实现类似的过滤器。