与 GCP VM 实例的 SSH 连接不稳定

与 GCP VM 实例的 SSH 连接不稳定

我是 GCP 新手用户,我正在尝试在“GCP 深度学习虚拟机”上运行深度学习模型。该模型最多可能需要 8-9 天才能运行。但 ssh 连接不稳定,几小时(5-8 小时)后没有响应,模型停止执行。

如何稳定SSH连接并完成模型训练?

答案1

对于像这样的长时间运行的任务,建议不要在 SSH 会话中直接运行它们。

类似的应用程序屏幕tmux屏风允许您恢复所有任务正在运行的会话,即使没有人通过 SSH 连接。

相关内容