在屏幕内运行 Python 程序时,程序有时会在刚启动后立即卡住,我无法使用 Ctrl+C 退出它。(会输入 ^C 但没有响应)。据我所知,这种行为完全不确定,并且很少发生。有问题的程序是在 Pytorch 中实现的,但不要认为问题是由程序中的错误引起的。
到目前为止,这种情况已经发生过三次。前两次,我尝试使用 Ctrl+A 并键入退出屏幕,:quit
或尝试使用kill
/终止 Python 程序kill -9
。使用后,kill -9
程序进入僵尸模式,我们不得不重新启动服务器,因为它阻塞了 GPU 内存并使用了 100% 的 CPU。
这次发生这种情况时,我更愿意来这里询问如何正确处理。奇怪的是,该程序没有占用任何 GPU 空间nvidia-smi
(这本身就很奇怪)。但该程序仍然使用 100% 的 CPU,如图top
所示。
pstree
给出这个:
systemd─┬
├─screen───python─┬─{python}
└─{python}
是否有解决方案可以正确地终止该程序以及如何防止这种情况再次发生?