NX 会话中运行的程序似乎在会话断开时暂停

NX 会话中运行的程序似乎在会话断开时暂停

我们目前正在运行一个交互式 HPC 应用程序,它向用户呈现一个图形界面,连接到 HPC 集群并允许他们运行和观察一些计算。用户通过 NoMachine NX 服务器登录到前端节点(此机器不参与计算)。他通常设置他的问题,进行一些小的试运行,然后开始一个大作业。之后,他断开与 NX 会话的连接,希望计算继续进行。

但事实并非如此。当用户断开连接时,NX 会话内以及整个集群中的所有执行似乎都会暂停。如果他恢复会话,他可以恢复计算,但这是他预计要运行几天的工作,因此期望 NX 会话始终保持连接状态可能不太现实。

我们知道,在很多方面,正确的用例是让用户找出他的参数,然后通过 ssh 提交批处理(非交互式)作业,但他更喜欢我上面概述的工作流程,所以我们正在尝试让它发挥作用。

相关内容