Google 计算引擎 - CPU 使用率警报

Google 计算引擎 - CPU 使用率警报

目前我们使用 AWS EC2 警报来关闭空闲实例。这种方法效果很好,因为我们可以启动一个长时间运行的批处理作业,并让 AWS 在工作完成后终止该实例。

GCE 有类似的东西吗?或者有人知道实现这一目标的解决方法吗?

答案1

ceejayoz 分享的链接很好。我想补充一点,如果您希望保留已安装和配置的应用程序或日志和数据,您也可以停止 GCE VM 实例,而不是删除它。这样,在停止实例后,您只需支付磁盘存储费用。

还请注意,gcutil 是一个已弃用的工具,已被 gcloud 工具取代。有关使用 gcloud 命令创建、删除、停止 VM 实例的更多信息,请参阅文章 [1][2] 和 [3]。在链接 [1] 中,您可以找到 GCE 实例的完整范围列表。

要手动删除虚拟机实例,您可以在Google Cloud 监控(由 Stackdriver 提供支持),选择 CPU 或 CPU 使用率作为监控指标,如果低于阈值并持续一段时间,则通知系统管理员。这样,在删除或停止实例之前,您将有机会重新运行失败的作业或脚本。

[1]https://cloud.google.com/sdk/gcloud/reference/compute/instances/create
[2]https://cloud.google.com/sdk/gcloud/reference/compute/instances/delete
[3]https://cloud.google.com/sdk/gcloud/reference/compute/instances/stop

答案2

除了 Kamran 建议的 Google Cloud Monitoring 解决方案之外,使用带有自动扩缩器的 Google Compute Engine 托管实例组是最好的选择,因为自动扩缩器可以从托管实例组中添加或删除实例。

要创建自动缩放程序,您必须指定自动缩放策略和自动缩放程序用来确定何时缩放组的目标利用率级别。

更多相关信息可参见帮助中心文章

相关内容