突然无法连接到 aws ec2 实例(服务器意外关闭网络连接)

突然无法连接到 aws ec2 实例(服务器意外关闭网络连接)

我的实例一切运行良好,但突然间我无法再通过 ssh 或 sftp 连接,并出现错误“服务器意外关闭网络连接”。

我的同事也有同样的问题!

一切似乎都运行正常(网络服务器运行良好)

我已经使用“启动更多类似程序”选项启动了另一个实例,一切运行正常。它可能与密钥文件上的 chmod 有关?!(这是我研究后发现的一个可能原因)但我不知道如何检查!

我也尝试从另一个 IP 和另一台计算机进行连接,结果相同。日志中没有记录任何特殊内容(似乎自实例启动之日起没有记录任何内容)。

我能怎么做 ?!

提前致谢

答案1

不幸的是我无法通过我的代表发表评论因此我将发布此答案。

我个人会采取与@prateek61 相同的方法。

如果不能登录到服务器,就很难诊断此问题。Linux 的一大优势是,一旦某些配置发生更改或触发,就不会允许任何人进入。

由于 AWS 中没有控制台访问权限,因此我将假设您无法关闭服务器来调查此问题:

如果您可以关闭服务器,那么您可以跳至步骤 3,但是我假定这是产品,您无法将其关闭。

  1. 创建卷的快照
  2. 从您刚刚拍摄的快照创建一个卷。
  3. 将新卷安装到您能够 ssh 连接的良好工作实例上。
  4. 安装后,转到卷并调查:
    • ssh 密钥的文件权限
    • 密钥本身是否正确
    • 检查 sshd 配置、sudoers 等。
    • 检查日志文件等。
    • 检查该服务器上是否运行了防火墙(因为这是已安装的卷,所以您无法检查这一点,但是您可以检查 /etc/rc3.d 以查看是否存在指向防火墙的符号链接)
    • 有时 fail2ban 或其他类似软件正在运行并阻止您再次访问服务器,请检查 /etc/rc3.d 中系统启动的内容。

找到问题所在后,您将需要弄清楚如何将其应用到正在运行的服务器上,即交换卷、创建新实例、重新指向流量等。这取决于服务器的用途以及您可以承受的停机时间,这是另一个主题。

再次,我将其作为答案发布,因为我无法发表评论。如果您想降低此评级,请给出理由。

相关内容