外部指标 HPA 出现不应该出现的峰值

外部指标 HPA 出现不应该出现的峰值

我有一个用于 HPA 的指标,问题是该指标有峰值,为了避免这种情况,我在 prometheus 上的记录规则中使用了一段时间内的平均值,但要将其导出到 stackdriver(在 gke 上),我使用了 stackdriver-prometheus-sidecar,它不会将记录的指标发送到堆栈驱动程序

关于如何导出此指标,您有什么想法吗?我发现的其他解决方案是使用 v2beta2 hpa 并更改行为以更改扩展时的稳定窗口,但这仅适用于 kubernetes 上的 v1.18,而 GCP 在稳定频道上只有 1.17 版本,您有什么想法吗?

答案1

将此答案发布为社区 Wiki。请随意扩展它。

重点关注扩展行为部分:

正如问题中所说。对可配置扩展行为的支持从 Kubernetes 版本 1.18 开始:

支持可配置的缩放行为

从...开始v1.18APIv2beta2允许通过 HPA 字段配置扩展行为。在字段或字段下的部分behavior中分别指定扩展和缩小的行为。可以为两个方向指定稳定窗口,以防止扩展目标中的副本数量发生波动。类似地,指定扩展策略可以控制扩展时副本的变化率。scaleUpscaleDownbehavior

Kubernetes.io:文档:任务:运行应用程序:水平 pod 自动缩放:支持可配置的缩放行为

Kubernetes 1.18 版包含对上述扩展的支持,包含在以下发行说明中Regular channel

2021 年 1 月 8 日(2021-R1)

版本更新

GKE 集群版本已更新。

可供升级和新集群使用的新版本

以下 Kubernetes 版本现已适用于新集群以及现有集群的可选主节点升级和节点升级。请参阅这些说明有关 Kubernetes 版本控制方案的更多信息。

常规渠道

笔记:您的集群可能没有这些版本可用。发布从通知发布之日起开始,需要四个或更长时间才能在所有 Google Cloud 区域完成。有关详细信息,请参阅推出时间表

  • 版本 1.17.14-gke.400 现已在常规频道中推出。此版本现在为默认版本。
  • 版本 1.18.12-gke.1201 现已在常规频道中推出。
  • 版本 1.17.13-gke.2600 不再在常规频道中提供。

常规频道中的自动升级节点会在此版本中自动从 1.17 版本升级到 1.17.14-gke.400 版本。


我鼓励每个人都查看发布渠道文档和每个渠道的属性(功能可用性和更新流失之间的权衡):


您还可以在此处发出功能请求,以将此功能反向移植到以前的GKE版本中:

相关内容