可能重复:
您使用什么工具来监控您的服务器?
您会推荐什么软件来监控网络?我们有一个主服务器,它充当 DNS 和其他服务。我们想监控网络活动:正在使用哪些协议、带宽等。
有点像老大哥的做法,知道用户何时尝试登录 GMail、Hotmail 等个人邮件帐户或使用外部 IM 帐户,这些是公司规则不允许的。如果可能的话,阻止这些访问(或能够知道这一点,以便采取相应的纪律处分)。
我读到过 Nagios 是一种监控服务,这是我们正在寻找的解决方案吗?还有哪些其他开源替代方案?
答案1
Nagios 是一个可靠的开源解决方案,插件架构意味着 nagios 基本上提供了一个监控框架,然后您可以插入所需的确切监视器。由于 nagios 相当流行,因此已经存在大量监控模块。
Nagios 主要是一个实时监控器,而不是报告器。我知道有办法将实时 nagios 数据传递到 cacti 或 munin 等报告应用程序,这些应用程序可以生成一些漂亮的图表。
答案2
这取决于您的网络规模以及您要监控的内容。对于中小型网络,纳吉奥斯似乎是首选的平台。
但是,一旦超过一定规模,“监控”就会被拆分成各种不同的功能,这些功能可能由相同的工具处理,也可能不由相同的工具处理。我学到的三个功能是:
- 故障管理
- 绩效管理
- 取证/相关性
故障管理捕获环境中需要立即采取措施修复的任何事件。链路故障、硬件故障、WAN 电路丢失等。这通常与您的警报系统相关。我听说 Nagios 在这方面做得很好。
绩效管理涵盖了那些不是紧急问题,但如果不加以注意,可能会成为紧急问题的事情。这基本上涵盖了与监控利用率和趋势相关的所有内容。LAN/WAN 带宽、路由器/交换机 CPU、接口上的错误和丢弃计数器。这是您在计划明年的采购和项目时要查看的内容;它告诉您网络的哪些部分需要关注,哪些部分运行良好。我是仙人掌;它在一个包中处理所有数据收集和呈现,并内置对设备 SNMP 轮询的支持。
取证/相关性适用于发生一次性事件并得到解决的情况,您需要查看历史数据。这可以是为了更好地了解实际发生了什么以及后果是什么,也可以寻找过去类似故障的实例。无论哪种方式,它通常都需要一个单一的存储库,其中包含尽可能多的日志数据,这些日志数据是您可以保留的、索引的和易于搜索的。Splunk在这方面绝对很棒,即使是免费版本也是如此;此外,您甚至可以将服务器日志放入 Splunk。只要所有内容都经过 NTP 同步,您就会拥有一个存储库,该存储库会向您展示您的应用程序、服务器和网络基础设施在事件发生期间的各个时间点看到的内容。
您要审计的其他内容更多地涉及网络安全,而不是网络监控。例如,通过使用正确配置的代理,可以轻松实现监控/限制用户浏览。尝试连接到外部 IM 服务的用户应该被您的 Internet 防火墙阻止;同样,防火墙日志可以导出到分析器,并运行报告以查找可疑的流量模式。事实上,如果可以的话,请尽量避免让您的用户工作站直接访问 Internet,方法是确保 Internet 无法从 LAN 内部路由。这会强制所有 Internet 流量通过您选择的代理,确保您可以完全控制所有入站和出站流量。
答案3
回答有关监控活动的部分问题(而不是检查您的服务器是否正在运行) - 任何像样的企业防火墙都应该包括通过它的流量的实时视图,以及对这些流量的回顾性报告。
在我上一份工作中,我们为客户提供了 Stonesoft 防火墙,并且为客户提供了这两种功能的管理界面。
答案4
我尝试过各种监控解决方案,总体来说我更喜欢 nagios,因为它灵活。如果您需要更多功能,还可以添加大量附加插件。