我已设置无服务器 VPC 连接器来路由来自 Cloud Run 服务实例的所有入口和出口流量。实例数量设置为默认最小值 2,最大值 10。当前有 8 个实例正在运行。Cloud Run 服务未收到任何请求,因此 VPC 连接器应处于“空闲”状态。但是,我看到 CPU 使用率激增 > 80%,而且似乎根本没有下降。文档说 VPC 连接器的实例可以向外扩展,但不能向内扩展。而且由于这些是“无服务器”的,我无法通过 SSH 进入它们。如何排查峰值的根本原因?
答案1
由于我的声誉不足以发表评论,因此我将将其作为答案发布。
如果您的 VPC 连接器未达到限制吞吐量并且 Cloud Run 没有遇到任何超时和断开连接,那么此时无需担心高 CPU 利用率。
如果您希望排除峰值的根本原因,我建议您尝试以下步骤。
- 转到 VPC 连接器的 CPU 利用率,并记下 CPU 利用率峰值超过 80% 的日期和时间。转到Cloud Run 的,检查、和VPC 连接器中的 CPU 利用率峰值是否同时
Metric section
增加。Request count
Sent bytes
Received bytes
Max. concurrent requests
- 如果您注意到 Cloud Run 的“指标”部分有所增加,这可以简单地解释 VPC 连接器上的 CPU 利用率过高。如果您没有注意到增加,您可以通过以下方式进一步排查问题:启用 VPC 流日志并使用日志浏览器检索、查看和分析日志数据。运行查询时,请确保将资源设置为
Subnetwork
>SUBNETWORK_ID
>SUBNETWORK_NAME
VPC 连接器。