基本上发生的事情是:
1)我重新启动机器(强制关机或按下重置按钮)
2)一切都很好
3) 在某个随机时间(重启后的 1-3 天内),以太网不仅在服务器上中断,而且在网络上的每个以太网设备上都中断。
注意:WiFi 上的设备完全不受影响。
4) 一旦出现此问题,系统将完全无响应。虽然我通常只通过 ssh 访问,而且机器通常没有头,但我确实暂时连接了键盘和显示器以进行故障排除。以太网中断后,它们就没有响应了,所以我根本无法进入系统查看发生了什么。
我是一个 Linux 新手,所以我可能错过了一些非常基本的东西。一切都很好,直到几周前(也许是几个月?时间混在一起了)我运行 apt-get update 时,这种情况才开始发生。如果不是因为所有硬重启都损坏了硬盘(我有备份,所以比其他任何事情都更烦人……但仍然如此),情况就不会那么糟糕,服务器崩溃还会破坏房子里其他所有东西的以太网(包括老公的 PC),而且我真的不能将它用作可靠的文件服务器,因为如果我让它整夜复制文件,我永远不知道复制是否能够在下次崩溃之前完成。
正如我所说,这台机器的用途只是一个文件服务器。它每天真正要做的就是运行 deluge、sshd 和 samba 来共享几个驱动器。就是这样。这不是一台主力机器,它是一台旧 PC 变成的媒体服务器……它很好地满足了我的需求……直到现在。如果有必要,我愿意购买一张新的以太网卡,但由于整台机器都坏了,我们甚至还没有真正将其隔离到以太网卡,我觉得这为时过早。
我还有以太网上受影响机器的 wireshark 日志,如果有人知道要查找的具体内容,我可以仔细阅读。我没有看到任何跳出来的东西(无论是缺乏流量还是流量突然激增或奇怪的错误消息)可以解释为什么没有任何东西可以连接到以太网。
它似乎最常在凌晨 1 点到 4 点之间崩溃,但它也曾在光天化日下崩溃,这很令人失望,因为我以为我已经将它隔离到 cron 几天了。:(
我很想升级到最新的 LTS 版本,但就目前而言,我担心机器会在升级过程中崩溃,我会失去一切,不得不重新开始。媒体都位于与操作系统不同的物理驱动器上,我可以轻松地在全新安装上配置 samba……但我永远也记不清我最终是如何让 deluge 与我的网络附加存储设备 (我只买过一个,因为它太麻烦了,我的其余存储都是服务器上的内部硬盘) 配合使用的。
编辑于 2015 年 1 月 15 日:系统已升级至 14.04.1 LTS。问题未在 14.04.1 LTS LiveCD 上发生,因此确认不是硬件问题。如果问题持续发生,则我们已将问题归咎于我的配置。
自完成升级以来,尚未发生任何系统和/或 LAN 崩溃,但我在系统日志中看到了这种情况
Jan 15 17:36:36 Atlantis kernel: [ 2740.669050] forcedeth 0000:00:07.0: eth0: link up
Jan 15 17:37:05 Atlantis kernel: [ 2769.664587] forcedeth 0000:00:07.0: eth0: link down
Jan 15 17:37:12 Atlantis kernel: [ 2776.773787] forcedeth 0000:00:07.0: eth0: link up
Jan 15 17:37:15 Atlantis kernel: [ 2779.450847] forcedeth 0000:00:07.0: eth0: link down
Jan 15 17:37:22 Atlantis kernel: [ 2786.557424] forcedeth 0000:00:07.0: eth0: link up
Jan 15 17:39:03 Atlantis kernel: [ 2888.205886] forcedeth 0000:00:07.0: eth0: link down
Jan 15 17:39:11 Atlantis kernel: [ 2895.403580] forcedeth 0000:00:07.0: eth0: link up
Jan 15 17:39:19 Atlantis kernel: [ 2903.777765] forcedeth 0000:00:07.0: eth0: link down
Jan 15 17:39:26 Atlantis kernel: [ 2910.914822] forcedeth 0000:00:07.0: eth0: link up
所以问题可能出在硬件上,但 14.04 设法阻止了一切崩溃??我会再运行几天,看看会发生什么。
编辑于 2015 年 1 月 17 日:再次发生。尝试从以太网 LAN 上的另一台机器 ping 8.8.8.8,首先 ping 超时约一分钟,然后开始返回“无路由到主机”。重新启动服务器或仅拔掉以太网电缆即可立即恢复所有机器的有线 LAN。
答案1
我认为这可能是硬件问题 - 网卡在变热或尝试进入睡眠状态后可能会缩短某些电路,从而导致 LAN 和 PC 死机。虽然不能 100% 确定。
因此,如果可能的话,请尝试更换网卡。如果是集成的,则插入新卡,不要使用集成卡 - 不要将网线插入旧卡并从 BIOS 中禁用它。