我需要在 Linux 上启动一个长时间运行、占用大量内存/磁盘/CPU 的进程,并对其进行监视,以便我可以:
- 检查它是否以良好的状态代码终止,
- 收集统计数据(每 x 分钟内存 CPU 磁盘一次)
- 如果进程不稳定,则发出警报或重新启动
有类似的东西吗?我知道有软件可以临时监视服务/守护进程,但不知道监视长期运行的进程。
答案1
这是一个很好的候选人监控,这是该问题的标签之一。
使用 Monit,您将能够查看进程状态、内存使用情况、CPU 使用情况、运行时间和其他详细信息。Monit 将允许您通过名称模式或 PID 跟踪进程。您还可以控制启动、停止或重新启动进程。