我正在运行一个 GCE 实例,并在其上运行一个 Kubernetes 集群。还配置了一个 HTTP 负载均衡器来探测此实例上运行的 Kubernetes 服务的运行状况。但我不断收到此错误:
Error: Server Error
The server encountered a temporary error and could not complete your request. Please try again in 30 seconds.
所以我想知道与负载均衡器相关的健康检查是否正在运行/配置正确。
我可以在哪里找到或如何启用此类健康检查器的日志文件?
该实例正在运行 Debian。
答案1
健康检查日志现已可用(撰写本文时处于测试阶段)通过云日志。
(注意:不支持旧版健康检查)
在云日志(以前称为 Stackdriver)使用如下过滤器:
logName="projects/<project-id>/logs/compute.googleapis.com%2Fhealthchecks"
查看(没有双关语的意思)健康检查日志文档了解更多信息。
下面的链接将:
- 带你进入云日志、日志查看器
- 预填充过滤器以显示全部最近的健康检查日志:
答案2
我正在排查类似的问题,环境包括 HTTPS 负载均衡器和托管实例组
搜索可用文档,没有找到访问该日志的痕迹,最后向 Google Cloud 团队提交了支持单,他们回复说健康检查日志不可供公众访问。Google 团队有内部工具来验证健康检查失败日志,并据此提出了建议。
我们可以选择使用 gcloud 命令检查健康检查,如下所示,但不能满足我们期望的日志要求
$ gcloud alpha compute http-health-checks
$ gcloud beta compute http-health-checks