Google Cloud Bigtable 上的监控和警报

Google Cloud Bigtable 上的监控和警报

我们正在 GCP 上构建数据管道,并选择 Bigtable 作为原始事件的数据仓库。我的问题是 - 我找不到正确监控集群的方法。仪表板提供了有限数量的指标,如果有任何方法可以将它们连接到 StackDriver 而没有太多麻烦,那么这些指标就可以解决问题,就像在 GCP 上设置所有其他服务一样。

是否可以使用 Stackdriver 监控 Bigtable?如果不行,还有其他推荐的方法来实现此目的吗?

我发现这个帖子这解释了如何获取针对 Bigtable 运行的请求的报告,但当我尝试了解整个集群的健康状况时,这并没有帮助。

答案1

Google Cloud Bigtable 将服务器端指标导出到 Stackdriver;您可以在Bigtable 文档Stackdriver 指标列表

此外,如果您正在使用与 HBase 兼容的 Bigtable Java 客户端,您可以导出 Dropwizard 指标在客户端,它将为你提供详细的客户端性能指标,例如端到端请求延迟,你可以自行跟踪这些指标,例如通过你自己的石墨实例。

这些指标并非旨在替代 Bigtable 的 Stackdriver 指标,而是对这些指标的补充,我们建议除了查看服务器端指标之外,还要跟踪客户端指标。

答案2

请注意,现在可以通过 Stackdriver Monitoring API 查询 Bigtable 指标: https://cloud.google.com/monitoring/api/metrics#gcp-bigtable

您还可以通过 Stackdriver UI 创建警报并定义 Google Cloud Bigtable 指标的自定义仪表板:https://app.google.stackdriver.com/

相关内容