我有一个剧本,我认为需要几天时间才能完成。基本上,当队列未满时,它会提交 slurm 作业,并且在此过程中它可以等待一段时间。
该脚本导致结果不完整,使我认为存在最大执行时间。这种默认超时真的存在吗?如果是的话,如何重置为无限时间?
答案1
Unix 系统一般没有程序的最大执行时间,但有共享计算集群经常对通过批处理系统(例如 SLURM 或 LFS 等)运行的作业强制执行最大执行时间。
请联系您正在使用的计算场的管理员。他们将能够帮助您调试此问题。如果集群上为提交给集群的作业设置了默认的最大执行时间,您的 SLURM 作业很可能会耗尽时间。
有时也会发生共享登录节点上的交互式会话设置超时的情况。同样,系统管理员将能够通知您这一点。