我的系统中有一个应用程序全天候运行。但不知何故它突然被终止了。在过去 10 天内,我观察到它 2 到 3 次。
现在我想找出我的应用程序停止了多长时间。这样我就可以通知它并能够从应用程序中找到错误。而且它还能帮助我创建 cronjob。
答案1
我建议在顶上及其服务atopsar
。它监控启动和进程的停止时间,以及磁盘使用情况和(通过额外服务)网络活动。
atopsar
定期(例如 5 分钟)监控您的进程并将其记录到文件中。之后您可以打开该文件并逐步查看历史记录,显示所有进程详细信息值,例如 CPU 和内存使用情况。也许这会为您提供程序崩溃的原因提示。
另外,请确保您的/etc/security/limits.conf
配置正确,以便获得核心转储。这为您提供了调试信息和时间戳。