假设有一个强化的 EC2 实例作为堡垒(笔记本电脑通过 ProxyJump 通过 ssh 连接到经过堡垒的服务器),需要监控哪些关键指标?我特别想知道是否存在任何不稳定的 SSH 连接以及我们如何即时修复。几天前,有一些 SSH 连接不断断开和/或超时。我们通过用户报告发现,最终只是简单地增加了实例大小,但这并不能真正帮助我们理解为什么这些连接不稳定。
假设有一个强化的 EC2 实例作为堡垒(笔记本电脑通过 ProxyJump 通过 ssh 连接到经过堡垒的服务器),需要监控哪些关键指标?我特别想知道是否存在任何不稳定的 SSH 连接以及我们如何即时修复。几天前,有一些 SSH 连接不断断开和/或超时。我们通过用户报告发现,最终只是简单地增加了实例大小,但这并不能真正帮助我们理解为什么这些连接不稳定。