我是一名 GCP 新手用户,尝试在具有 4 个 CPU、4 个 GPU、15 GB RAM 和 30 GB 磁盘空间的 Linux 实例上并行运行 4 个脚本。
但是,初始化脚本几分钟后,WinSCP 和 PuTTY 都会断开我与服务器的连接,我无法重新连接。该实例似乎继续在 GCP 网站上运行。我尝试创建一个新实例,但问题仍然存在。
当我在实例上仅运行一个脚本时,没有任何问题。
知道是什么原因造成的吗?任何线索都会有很大帮助,谢谢!
答案1
这可能是由于您的服务器在同时运行 4 个脚本时负载过重而导致 OOM Killer 杀死了 sshd。您可以监控虚拟机负载,并检查您被踢出 ssh 的时间是否是负载峰值时。
您可以尝试:重新启动服务器,重新连接并检查日志中 OOM Killer 是否启动。