基本上,我正在使用自定义配置监控 php-fpm error.log 文件:
<source>
type tail
format none
path /var/log/php-fpm/error.log
pos_file /var/lib/google-fluentd/pos/php-fpm-error.pos
read_from_head true
tag php-fpm-error
</source>
使用如下自定义日志指标:
resource.type="gce_instance"
resource.labels.instance_id="123456"
logName="projects/example/logs/php-fpm-error"
"exited with code 127"
在 Metrics Explorer 中,如果我选择“计数”作为聚合,我可以非常清楚地看到指标上的错误事件。但是,在警报策略中,我没有看到指定聚合的方法。
最好的方法就是将警报策略设置为“计数超过 0”并采用“针对最新值”吗?这似乎很奇怪,因为度量值非常小,例如 0.02。
谢谢
答案1
一个警报策略Stackdriver 监控用于在应用程序运行不正常时通知您。例如,如果您的应用程序在 X 时间内以“代码 127”退出五次,您可以设置警报。
如果您希望监控此类事件,我建议创建一个仪表板,在这里您可以设置自定义指标作为“资源类型”,并且可以选择设置“聚合资源”