我有一个计算实例(Ubuntu 20.04),最近安装了 google-cloud-ops-agent(通过各种监控仪表板上的“安装代理”按钮,通过 Cloud Shell 安装代理,以及从 VM 内部手动下载和执行安装 bash 脚本)。代理似乎安装正常,服务正在 VM 中运行,但监控仪表板仍在代理状态中报告“待处理”;一段时间后最终回到安装前的“未检测到”状态。
有人可以指出我应该开始查看以进行故障排除的防火墙规则、IAM 服务帐户权限、日志或其他内容吗?
答案1
答案2
您应该尽可能避免在项目或组织层使用基本角色“编辑者”和“所有者”,尤其是当这是针对企业帐户时。操作代理的最低权限规则是“监控指标编写者”和“日志编写者”。这将允许它将指标写入监控窗格并为事件创建日志。
不过,这只是最佳实践,如果您只是临时测试,可能不是什么大问题。
答案3
如果你还没有检查过,请查看公共 Ops Agent 故障排除指南是否有帮助。它应该涵盖了大多数问题。你可以找到它这里