如何找出这个进程在 Ubuntu16.04 上意外终止的原因

如何找出这个进程在 Ubuntu16.04 上意外终止的原因

我尝试运行一个在服务器上训练 lstm 模型的 python 脚本。

(图1服务器的操作系统信息。)

这是服务器的操作系统信息。

但每次训练结束前,该进程都会被终止。

(图2&3为终止进程的截图) 终止进程的屏幕截图

终止的进程和使用的内存的信息

但我发现 cmd 'ps -aux' 与 cmd 'free -mt'&'vmstat -a' 不一致。

我怀疑内核是否杀死了该进程(因为系统内存不足)。所以我尝试查找内核日志。

但 /var/log 下没有我想要列出的日志文件。

/var/log 下列出的文件

谁能帮我看看 python 脚本运行中到底发生了什么?

或者告诉我如何找到一些记录为什么这个进程被终止的日志?

答案1

如果您的脚本没有显式生成日志,您可以通过重定向将标准输出和错误(跟踪调用)重定向到特定文件。

name-of-your-script.py > /var/script.log 2>>&1

您还可以使用该strace实用程序找到有价值的信息。

相关内容