我的Linux版本是Linux 3.4.76-65.111.amzn1.x86_64 x86_64
.这是AWS。
这些天我因缺乏监控工具而苦恼,进程有时会在不知不觉中死亡。
我的需求很简单。虽然它们可能是通过我自己的 shell 脚本实现的,但我希望它由工具管理。
- 如果特定进程死亡则发出警报
- 资源(硬盘空间、CPU、内存)达到阈值时发出警报
- 跟踪资源使用情况
- 免费供企业使用
答案1
我会使用 Nagios。在我不久前所做的一项调查中,我注意到这是大多数人的最爱。请注意,许多站点使用多种监控工具。
我想提醒您,“免费”仅意味着源代码可用,仍然需要付出努力(在任何情况下),而这并不是免费的。
顺便说一句,Nagios 有免费和付费支持版本。
答案2
Zabbix
我第一个想到的就是这个。这是我在家用的。它可以对资源利用、流程发出警报,并进行历史跟踪。请注意,它需要在服务器上安装代理。
或者,Cacti
也可以通过警报插件执行您需要的操作。
答案3
看一眼网络敏及其变体。