服务器意外重启,日志文件中出现奇怪的内核消息

服务器意外重启,日志文件中出现奇怪的内核消息

我有一台运行 Ubuntu 10.04 的服务器,它似乎每天都要重启好几次,我不知道为什么。它似乎也不是一次正常重启,因为当我查看它们的日志时,有些服务会抱怨崩溃。我查看了 /var/log/messages,发现很多奇怪的内核语句,如下所示:

Jul 27 13:28:41 it-admin kernel: [ 5198.213173] r8169: eth0: link up
Jul 27 13:20:38 it-admin kernel: [ 4716.055043] r8169: eth0: link up
Jul 27 13:29:37 it-admin kernel: [ 5253.309017] r8169: eth0: link up
Jul 27 13:30:29 it-admin kernel: [ 5305.593953] r8169: eth0: link up

正如您所见,这些每隔几秒就会打印出来。我以前从未见过内核这样说,所以我想知道这是否与此有关。

答案1

这些错误消息对应于某些内核中的 r8169 驱动程序与某些硬件之间的问题,导致它反复丢失链接(称为“瘫痪”),但稍后才能恢复,通常会导致连接问题。Ubuntu 有一个针对旧版本的错误报告,未解决,请关闭https://bugs.launchpad.net/ubuntu/+source/linux/+bug/378907

内核升级可能会解决这个问题,并且已经成功地解决了一些人的问题,还有一些关于修复的讨论,据说在http://adam.rosi-kessel.org/weblog/2008/06/21/a-much-simpler-fix-for-the-r8169-link-down-problem,但在我的(Debian Unstable)系统上,使用较新的 2.6.3x 内核,修复此问题的唯一可靠方法是安装 Realtek 自己的第三方驱动程序,以 8168 的名称加载,这样就不会出现此问题。我会按顺序尝试这些方法。

我不确定这个问题与意外重启有何关联。这些消息可能与您最初的重启问题无关,也可能是您的机器出现了特别严重的问题,或者您可能遇到了类似的症状,但问题与此完全不同。

答案2

我觉得这像是硬件或驱动程序问题。系统真的重新启动还是您只看到 r8169 消息并且链接一直在断开?

如果它不是一直重新启动:r8169 驱动程序存在一些已知问题。一种选择是禁用 NIC 的自动协商

/sbin/ethtool -s eth0 autoneg off

摘自这里: http://www.fedoraforum.org/forum/showpost.php?p=1394807&postcount=1

相关内容