服务器无法访问并自行恢复（很可能是网络问题）

Question 1

此类问题通常不会生成大量日志消息。您发现了两条重要的消息，它们显示接口关闭和打开。拔下以太网电缆并重新插入即可生成这些消息。

可能是 NIC 和路由器之间的电缆有问题。我的第一步（一次完成一步）是：

更换连接到 eth0 的电缆，看看是否能解决问题。
重新配置网络接口，使当前 eth0 上的流量在 eth1 上，反之亦然。（需要重新启动网络并交换电缆。）如果问题仍然存在，则就像 NIC 出现故障。
验证上游设备及其电源的状态。如果断电或出现其他故障，您就会看到这种行为。
运行netstat -i或ifconfig检查错误计数。通常，它们应该是 0 或个位数。高载波或帧错误可能表示双工不匹配。可以通过上传然后下载大型文件来验证双工不匹配。速度差异大且错误计数增加表示链路不匹配。有线调制解调器通常具有不同的上传和下载带宽，因此本地传输更适合此测试。

我确实使用的一个工具是mtr。我使用类似命令mtr -i 15 -n google.com来监控连接。考虑使用您的 ISP 服务器之一而不是 google.com。它可以批量以报告模式运行。如果问题出在服务器上游，则输出应该有助于识别问题发生的位置。

Answer

此类问题通常不会生成大量日志消息。您发现了两条重要的消息，它们显示接口关闭和打开。拔下以太网电缆并重新插入即可生成这些消息。

可能是 NIC 和路由器之间的电缆有问题。我的第一步（一次完成一步）是：

更换连接到 eth0 的电缆，看看是否能解决问题。
重新配置网络接口，使当前 eth0 上的流量在 eth1 上，反之亦然。（需要重新启动网络并交换电缆。）如果问题仍然存在，则就像 NIC 出现故障。
验证上游设备及其电源的状态。如果断电或出现其他故障，您就会看到这种行为。
运行netstat -i或ifconfig检查错误计数。通常，它们应该是 0 或个位数。高载波或帧错误可能表示双工不匹配。可以通过上传然后下载大型文件来验证双工不匹配。速度差异大且错误计数增加表示链路不匹配。有线调制解调器通常具有不同的上传和下载带宽，因此本地传输更适合此测试。

我确实使用的一个工具是mtr。我使用类似命令mtr -i 15 -n google.com来监控连接。考虑使用您的 ISP 服务器之一而不是 google.com。它可以批量以报告模式运行。如果问题出在服务器上游，则输出应该有助于识别问题发生的位置。

Question 2

BillThor 有一些很好的建议。如果他的解决方案都不能解决问题，那么自动协商可能是罪魁祸首（尽管可能性不大）。尝试强制连接的速度和双工（RedHat 的说明，但其他发行版也类似）

编辑 /etc/sysconfig/network-scripts/ifcfg-eth0：

ETHTOOL_OPTS="speed 100 duplex full autoneg off"

然后重启界面：

/etc/init.d/network restart

Answer

BillThor 有一些很好的建议。如果他的解决方案都不能解决问题，那么自动协商可能是罪魁祸首（尽管可能性不大）。尝试强制连接的速度和双工（RedHat 的说明，但其他发行版也类似）

编辑 /etc/sysconfig/network-scripts/ifcfg-eth0：

ETHTOOL_OPTS="speed 100 duplex full autoneg off"

然后重启界面：

/etc/init.d/network restart

相关内容