突然与虚拟机实例的 SSH 连接失败

突然与虚拟机实例的 SSH 连接失败

今天突然发现与我的 VM 实例的 SSH 连接需要很长时间才能成功。

我不愿意通过创建新实例来重复我的所有工作。而且,我不知道问题是否与磁盘空间有关。

有人可以帮忙吗?

答案1

首先,你应该收集日志

  1. 转到Compute Engine-> VM instances-> 单击 NAME_OF_YOUR_VM -> 在VM instance details查找部分日志并点击Serial port 1 (console)
  2. 再次重新启动您的 VM 实例。
  3. 检查完整启动日志中是否存在任何错误或/和警告。

如果发现与磁盘空间相关的错误/警告您可以尝试根据文档调整其大小调整区域永久性磁盘的大小,也根据文章恢复无法访问的实例或完整的启动磁盘

如果实例的磁盘空间完全用完,或者没有运行 Linux 客户环境,则无法自动调整根文件系统的大小,即使您增加了支持它的持久磁盘的大小也是如此。如果您无法连接到实例,或者启动磁盘已满且无法调整其大小,则必须创建新实例并从快照重新创建启动磁盘以调整其大小。

否则尝试通过串行控制台排除虚拟机实例故障

  1. 启用串行控制台连接使用gcloud命令:

     gcloud compute instances add-metadata NAME_OF_YOUR_VM_INSTANCE \
     --metadata serial-port-enable=TRUE
    

或前往Compute Engine-> VM instances-> 点击NAME_OF_YOUR_VM_INSTANCE-> 点击EDIT-> 前往部分Remote access并检查Enable connecting to serial ports

  1. 创建临时用户和密码登录:关闭你的虚拟机并设置一个启动脚本通过添加在部分Custom metadatastartup-script和值:

     #!/bin/bash
     useradd --groups google_sudoers tempuser
     echo "tempuser:password" | chpasswd
    

然后启动您的虚拟机。

  1. 通过串行端口连接到您的虚拟机使用gcloud命令:

     gcloud compute connect-to-serial-port NAME_OF_YOUR_VM_INSTANCE
    

    或前往Compute Engine-> VM instances-> 点击NAME_OF_YOUR_VM_INSTANCE-> 然后点击Connect to serial console

  2. 检查哪里出了问题。

  3. 禁用通过串行端口访问使用gcloud命令:

     gcloud compute instances add-metadata NAME_OF_YOUR_VM_INSTANCE \
     --metadata serial-port-enable=FALSE
    

或前往Compute Engine-> VM instances-> 点击NAME_OF_YOUR_VM_INSTANCE-> 点击EDIT-> 前往部分Remote access并取消选中Enable connecting to serial ports。请记住,根据文档与串行控制台交互

警告:交互式串行控制台不支持基于 IP 的访问限制,例如 IP 白名单。如果您在实例上启用交互式串行控制台,客户端可以尝试从任何 IP 地址连接到该实例。如果知道正确的 SSH 密钥、用户名、项目 ID、区域和实例名称,任何人都可以连接到该实例。使用防火墙规则来控制对您的网络和特定端口的访问。

如果你无法通过串行控制台连接,尝试按照文档操作SSH 故障排除部分检查虚拟机实例而不关闭它在另一台虚拟机上检查虚拟机的磁盘. 您可以使用相同的方式将数据传输到另一个正在运行的 VM 实例。

答案2

对我有用的方法是进入虚拟机实例并重置它。我没有丢失任何东西,重置后我的 WordPress 网站仍然配置正确,并且可以重新登录虚拟机实例

相关内容