我在 Ubuntu 20.04.4 LTS 上运行机器学习训练过程。运行过程在 tmux 会话中。
管理员说放假的时候服务器会宕机,不知道有什么bg
命令可以让服务器重启后恢复?或者只能在checkpoint模型上恢复训练。
训练源代码:https://github.com/deepinsight/insightface/tree/master/recognition/arcface_torch
我在 Ubuntu 20.04.4 LTS 上运行机器学习训练过程。运行过程在 tmux 会话中。
管理员说放假的时候服务器会宕机,不知道有什么bg
命令可以让服务器重启后恢复?或者只能在checkpoint模型上恢复训练。
训练源代码:https://github.com/deepinsight/insightface/tree/master/recognition/arcface_torch