如何在 Google Cloud Platform 上手动安装 Stackdriver Monitoring

如何在 Google Cloud Platform 上手动安装 Stackdriver Monitoring

我们在 Google Cloud Platform(GKE 使用主版本 v1.12.9-gke.15)上运行多个微服务,并一直使用 Stackdriver 集成进行日志记录和监控(https://cloud.google.com/monitoring/kubernetes-engine/installing)。不幸的是,我们还需要自定义日志解析,目前无法同时进行自定义日志解析和 Stackdriver 监控(这里也讨论过:https://stackoverflow.com/questions/57528039/gke-stackdriver-kubernetes-engine-monitoring-and-custom-log-format)。看来我们必须关闭与 StackDriver 的自动集成,以进行日志记录和监控。

我的问题是:我需要向我们的集群应用什么来补充自动 StackDriver 监控集成?

我专门寻找有关特定部署实现的功能以及可以直接应用于集群的官方部署描述符的描述。

据我所知,启用和禁用“Stackdriver Kubernetes Engine 监控”之间的区别在于监控相关部署:

  1. 事件导出器-v0.2.4
  2. heapster-v1.6.1
  3. stackdriver-元数据代理集群级别

以下是我目前发现的内容:

  1. 事件导出器支持从集群收集事件(信息:https://github.com/Stackdriver/kubernetes-configshttps://github.com/GoogleCloudPlatform/k8s-stackdriver/tree/master/event-exporter)。我缺少官方的 YAML 描述符,因此无法手动部署它(引用的链接中的 YAML 描述符不是最新的)。
  2. metrics-server-v0.3.1(无论启用什么都处于活动状态)和据我所知正在取代 heapster 部署(来源:https://github.com/kubernetes-retired/heapster/blob/master/docs/deprecation.md)还应该部署吗?
  3. 我在这里找到了一些对 stackdriver-metadata-agent-cluster-level 的引用:https://cloud.google.com/gke-on-prem/docs/concepts/logging-and-monitoring#stackdriver_gkeop这里有一些描述符:https://github.com/kubernetes/kubernetes/blob/master/cluster/addons/metadata-agent/stackdriver/metadata-agent.yaml但是他们描述的守护进程和部署以及设置似乎与我的不同。

最后还有一个子问题:这个列表是否完整,可以完全实现对 Kubernetes 集群的监控?

(注意:我省略了与日志相关的部署和守护进程集。使用我们自定义部署的配置对其进行补充已在网络上充分记录。此外,我们确实需要对日志的解析进行自定义。)

相关内容