![NX 会话中运行的程序似乎在会话断开时暂停](https://linux22.com/image/561806/NX%20%E4%BC%9A%E8%AF%9D%E4%B8%AD%E8%BF%90%E8%A1%8C%E7%9A%84%E7%A8%8B%E5%BA%8F%E4%BC%BC%E4%B9%8E%E5%9C%A8%E4%BC%9A%E8%AF%9D%E6%96%AD%E5%BC%80%E6%97%B6%E6%9A%82%E5%81%9C.png)
我们目前正在运行一个交互式 HPC 应用程序,它向用户呈现一个图形界面,连接到 HPC 集群并允许他们运行和观察一些计算。用户通过 NoMachine NX 服务器登录到前端节点(此机器不参与计算)。他通常设置他的问题,进行一些小的试运行,然后开始一个大作业。之后,他断开与 NX 会话的连接,希望计算继续进行。
但事实并非如此。当用户断开连接时,NX 会话内以及整个集群中的所有执行似乎都会暂停。如果他恢复会话,他可以恢复计算,但这是他预计要运行几天的工作,因此期望 NX 会话始终保持连接状态可能不太现实。
我们知道,在很多方面,正确的用例是让用户找出他的参数,然后通过 ssh 提交批处理(非交互式)作业,但他更喜欢我上面概述的工作流程,所以我们正在尝试让它发挥作用。