我想知道最公开安装或广泛使用的 Linux 系统性能监控软件是什么,该软件可用且与 Ubuntu 64 位兼容?
我已经安装了 Nagios 用于可用性报告,但对于超过 10 的监控性能,为每个服务器打开运行 top 的 SSH 控制台是不切实际的。
我想要监控的是:1. 磁盘空间问题。2. 资源占用过大。3. root/sudo 登录尝试失败。4. 还有什么问题吗?
如有任何建议我将不胜感激。
谢谢。
答案1
答案2
答案3
您需要在每个受监控的 Ubuntu 主机上安装一个 SNMP 服务器来监控性能和磁盘空间,并安装一个中央 syslog 服务器来监控日志消息。
有大量的工具可以从 SNMP 服务器收集和绘制数据图表,而且我所知道的所有 syslog 服务器都可以从远程机器收集 syslog 事件。
答案4
您引用的指标是性能限制 - 您没有衡量服务器性能 - 尽管话虽如此,但可用于性能监控的现成 Nagios 插件非常少。
我建议使用 Nagios 作为测量和报告性能问题的工具 - 但您说您已经安装了它,但“为每个服务器打开运行 top 的 SSH 控制台是不切实际的。” - 这对我来说没有多大意义 - Nagios 是专门为您设计来做到这一点的!看看国家可再生能源计划有关如何从中央服务器管理监控的详细信息。
“磁盘空间问题”-在标准 nagios 插件中
“资源占用”——这是一个相当没有意义的指标。您可以从 /proc 文件系统获取当前/累计 CPU 和内存使用情况、# 打开文件数和每个进程的其他统计信息 - 将它们包装在 aa 脚本中以创建nagios 插件很简单对于测量每个进程的磁盘 I/O,这在 2.4 和早期的 2.6 内核上总是有点问题 - 但我知道现在在较新的内核中这是可能的 - 请参阅iotop用于 Python 中的实现。
“root/sudo 登录尝试失败”。正如我过去经常说的那样,写入日志的大部分安全信息会告诉您安全在哪里正常运行 - 也就是说,大部分信息都毫无意义。重要的是您的安全在哪里受到威胁。您应该关注的是成功的 root 访问。Nagios 有日志监控插件。
“其他任何事情”——嗯,是的,性能监控。有用于在各种服务上注入事务的工具,可用作 Nagios 的插件,但如果不知道需要测量哪些服务,就很难更具体。