我正在运行由一家公司托管的 Debian Jessie 服务器(因此我只能远程访问它),上面运行着几个基于 LXC 的虚拟机,这些虚拟机依次运行从 XMPP 到 IMAP、SMTP 和 IRC 的多项服务。有时,大概每周两次,我观察到以下影响:服务器(主机和所有客户机)对我正在运行的任何基于 TCP 或 UDP 的服务没有响应。我仍然可以 ping 它,但对于任何基于 TCP/UDP 的服务,数据包每次 2 分钟内都无法到达,最多一个小时。有时,连接变得相当不稳定,服务器每隔 2-3 分钟即可访问,我可以建立连接的窗口很小。
我记录了一段时间内的系统统计数据,如硬盘使用率、CPU 使用率和内存使用率,没有任何异常。CPU 使用率通常低于 20%,并且从未使用过交换区。
我想让我的数据中心负责解决这个问题,但是服务器始终可以 ping 通,所以我怀疑问题出在我的服务器的路由上。
由于此问题很少发生,我不想将所有 LXC 服务都下线,以查看问题是否与其中某个服务有关。相反,我希望能够在观察到此问题时运行更多诊断程序。
我可以使用哪些其他工具来调试此问题?