我们能列出 cron 作业崩溃或终止的所有可能原因吗?

我们能列出 cron 作业崩溃或终止的所有可能原因吗?

我们有一些 cron 作业不能停止,否则后果将是灾难性的。所以我们需要密切关注这个过程,并确切知道是什么导致了作业的死亡。所以我想问你作业死亡的任何可能原因,症状是什么,返回的值是什么,系统错误日志存储在哪里。

我们正在使用两台服务器。一台是“Red Hat Enterprise Linux AS release 3 (Taroon Update 2)”,另一台是 AIX 7.1。我想知道默认情况下是否启用了任何 OOM 杀手。

我们仅使用用户帐户,因此无法查看系统日志,例如 /var/log。

该作业可以是内部有 Java 程序的 Shell 脚本。

答案1

我想知道默认情况下是否有任何 OOM 杀手。

我不太了解 AIX 的实现,但是Linux 当然有内存溢出修复程序在内存不足的情况下触发。此外,您可能会看到通过 ulimit 或类似工具设置的资源限制。

我们有一些 cron 作业不能停止,否则后果将是灾难性的。

这是设计上的缺陷。错误发生,故障发生——你必须能够处理这些。

症状是什么,返回的值是什么

这完全取决于您正在运行的进程。它可能会选择或可能不会选择向操作系统返回有意义的值。事实上,Java 异常的情况很棘手 -即使在堆栈跟踪之后,shell 返回代码也可能为零因此如果您无法更改 Java 代码,则应该解析输出以捕获错误。

相关内容