如何通过 Google Cloud 代理监控日志以发现错误发生?

如何通过 Google Cloud 代理监控日志以发现错误发生?

基本上,我正在使用自定义配置监控 php-fpm error.log 文件:

<source>
  type tail
  format none
  path /var/log/php-fpm/error.log
  pos_file /var/lib/google-fluentd/pos/php-fpm-error.pos
  read_from_head true
  tag php-fpm-error
</source>

使用如下自定义日志指标:

resource.type="gce_instance"
resource.labels.instance_id="123456"
logName="projects/example/logs/php-fpm-error"
"exited with code 127"

在 Metrics Explorer 中,如果我选择“计数”作为聚合,我可以非常清楚地看到指标上的错误事件。但是,在警报策略中,我没有看到指定聚合的方法。

最好的方法就是将警报策略设置为“计数超过 0”并采用“针对最新值”吗?这似乎很奇怪,因为度量值非常小,例如 0.02。

谢谢

答案1

一个警报策略Stackdriver 监控用于在应用程序运行不正常时通知您。例如,如果您的应用程序在 X 时间内以“代码 127”退出五次,您可以设置警报。

如果您希望监控此类事件,我建议创建一个仪表板,在这里您可以设置自定义指标作为“资源类型”,并且可以选择设置“聚合资源”

相关内容