我正在考虑设置一个工具来收集来自不同平台上多个系统的使用数据和 KPI。我们希望定期报告系统使用情况和健康状况的关键指标。它不需要实时监控,只需每月监控性能和使用情况指标即可。
需要输入数据的系统包括运行大型 ERP 应用程序的 Solaris 系统和运行我们内部网的 IIS。我们将为每个系统确定 2-5 个 KPI,然后编写某种脚本从每个系统中提取数据。数据包括用户名使用情况、应用程序使用情况以及每个站点的响应时间等性能数据。
是否有任何现成的应用程序可以存储和报告各种指标?
在我看来,它需要免费或者便宜,否则我们只能自己创建和维护一个小型数据库。
答案1
有许多不同的商业监控工具,HP OpenView Operations 尤其是性能监控器可以满足您的需求,但它们都非常昂贵。我认为您应该首先不要说您想要什么,而是说您希望实现什么:“我们希望定期报告系统使用情况和健康状况的关键指标”。您是否在查看环境中服务器的硬件健康状况?HP SIM 或其他基于 SNMP 的工具在这里是合适的。您是否在寻找系统重要统计数据,例如 CPU 使用率、硬盘空间、网络使用率?对于 Linux,您需要 sar、collectd。对于 Windows,我认为您可以通过 SNMP 获得这些统计数据。
根据您的环境,集中精力监控应用程序性能和健康状况可能比监控底层操作系统更合适。CPU、网络峰值是粗略的衡量标准,在复杂的环境中,您不一定关心它。首先测量每秒的事务数,这样您就知道是否有问题需要调查。
查看日志监控工具(如 splunk)可能是合适的,因为您的系统通常会告诉您是否有问题。同样,这取决于您真正想要实现的目标。
OVO 可能是可以满足您需求的工具,但价格昂贵。对于开源工具,请查看 cacti、nagios 和 collectd。
答案2
答案3
“是否有任何现成的应用程序可以存储和报告各种指标?”
你的操作系统?:)
指标数据是否由简单的数字组成,其语义是否可被脚本理解?SNMP 可以从跨平台系统中提取各种数据,但对于不存在于通常 MIB 中的任何内容,您必须指定 exec 调用。
正如您所说,我认为自定义方法是最适合您的方法,只需一些脚本和一个数据库。