占用大量带宽的 Linux 服务器造成问题

占用大量带宽的 Linux 服务器造成问题

我们有一台 Linux 服务器 (2.6.28-11-generic #42-Ubuntu) 在客户端上出现故障,占用了客户端完全不可接受的带宽百分比,我们正在试图找出它到底在做什么。而拥有系统管理员技能的人还没有被替换。

我们不知道是什么导致了这么多网络流量,需要尽快找出原因。我应该查看哪些日志文件来查找这些信息?您会推荐哪些分析工具来完成这项任务?

请注意,我不是在寻找一种可以让我分析未来流量的工具。客户即将完全关闭机器;如果可能的话,我需要弄清楚它用我已有的数据做了什么。

我提前感谢您帮助开发猴子扮演系统管理员。

答案1

如果它快速移动大量数据,我会查看 /var/log/* 中是否有任何大量日志活动,即 httpd/ 和 FTP。否则,请检查 /var/log/security 和 /var/log/messages,它们将包含大部分系统日志。

华纳推荐了一些不错的工具,我建议打开并监控正在发生的流量。如果您希望系统关闭,请将其从网络上移除,并在断开与主网络的连接的情况下运行上述工具。

答案2

如果您已经毫无疑问地隔离了服务器..

网络流量监控对于本地服务器的带宽测量很有用。

ntop有助于更高层次的细分。如果您现在安装并开始运行,它可以分析过去的流量。

最终,tcpdumpwireshark应该是您所需要的。

否则,我会花时间在网络设备上隔离和分析流量。 网流是网络管理员愿意花大价钱去做的事情,但前面提到的 OSS 工具可以完成同样的功能。

最终,如果您尚未配置某些功能,则不太可能在日志中找到特定于流量的证据。根据协议,您可以分析 Apache 日志和其他应用程序日志以了解历史模式。如果您尚未在任何级别进行隔离,那么如果不启用其他工具,您将会遇到困难。

相关内容