我在一家中型公司工作(员工超过 100 人)。一个不断出现的问题是网络性能,尤其是互联网接入。
我们有大约 70 台或更多台计算机,包括 Mac OS X 和 Windows XP & 7 计算机。我们有几台服务器(Exchange 服务器、PC 文件服务器、MS SQL、Blackberry、FTP、Mac 服务器等)。服务器机房中有四台主交换机、一台 SonicWall 防火墙,可能还有几台路由器,还有十几台路由器散布在大楼各处。
网络结构多年来一直在自然发展;据我所知,目前还没有一个监控解决方案。当我们遇到网络问题(连接速度慢、丢包等)时,我们的一般解决方案是关闭某些硬件的电源或走到每位员工身边询问他们是否正在上传/下载任何大文件。
这确实效率低下且耗时,而且它不允许我们监控网络,主动解决潜在问题。我希望找到一种解决方案,可以让我实时监控整个公司的网络使用情况,最好能详细到每台电脑。
鉴于设备和操作系统的混乱,最好的监控解决方案是什么?硬件、软件,还是重构我们的网络架构?
答案1
答案2
我推荐经过时间考验和验证的 Nagios 和 MRTG 组合。Nagios 用于监控和警报,MRTG 用于长期监控,这通常会显示可能被忽视的趋势。还有其他选择,但我发现这两个可以完成其他所有功能,但设置和配置起来更容易,尽管这可能只是个人偏好。
答案3
已安装的 Sonicwall 还可以立即提供非常基本的互联网使用情况报告:按 IP 划分的最高带宽使用情况、按端口/协议划分的最高带宽使用情况。Viewpoint 是一个附加组件,可提供更深入的报告。这不会解决端到端网络性能这一更大的问题,但可以同时提供有关互联网性能问题的一些信息。
答案4
如果您正在寻找接口级流量,那么像 Nagios 这样的简单 SNMP 解决方案就很合适。只需监控您的路由器或 Sonicwall 接口并查找繁忙的接口即可。
如果您还想关注网络中的用户活动(谁在下载大文件或运行 torrent),那么您需要的不仅仅是 SNMP。您需要监控流量甚至原始数据包。
您可以尝试 NTOP,如果您可以让它与 MySQL 或 RRD 文件很好地协同工作,那么它是一个很好的软件包。
您可以尝试一款名为 Trisul Network Metering and Forensics 的软件工具,它将为您提供所有这些信息。(免责声明:我在那里工作)。如果您对最近 3 天窗口的实时情况感兴趣,它也是完全免费的,从您的问题来看,这应该很适合您。您可以监控每个用户的长期和当前使用情况。
对于任何解决方案,您都需要确定网络中的有利位置,例如防火墙或服务器机架前面的路由器/交换机。如果您的设备支持 Netflow 或 Sflow,请使用它们或端口镜像您的瓶颈并将数据提供给 Ntop 或 Trisul。