Linux 服务器似乎会随机断开网络

Linux 服务器似乎会随机断开网络

所以这是一个非常令人困惑的情况。我们使用一台 Linux 服务器来运行一个古老的 ERP(会计和销售订单),并且它似乎会随机地与本地网络断开连接。我将列出整个过程,以防我遗漏了重要信息。

两周前的星期五,我决定将本地对等网络从共享 IP 电话网络中移除,因为我没有意识到托管电话网络也意味着将我锁定在本地对等网络之外。因此,我断开了托管网络中的所有设备,并使用新的 IP、调制解调器、交换机和路由器创建了一个新的对等网络,完全独立。我不是网络专家,所以我花了一段时间才让所有花哨的东西正常工作,但我在 24 小时内就让一切恢复正常。

周日在家远程工作(使用 SSH/Telnet)时,我注意到电子邮件服务器无法正常工作(Linux 服务器的一部分)。我觉得很奇怪,这恰好与我的网络切换时间吻合,但由于其他一切都运行正常,我继续向硬件供应商提交故障单,指出服务器出现电子邮件故障。

星期一早上,支持人员回复说,从他们所看到的来看,没有任何问题,没有错误,也没有问题。但是,仍然没有电子邮件。所以我重新启动了服务器,瞧,电子邮件又可以正常工作了。几天过去了,一切都很顺利,直到星期五,我们开始收到来自服务器的本地网络断开连接。我们可以立即发现,因为我们的 PC 终端仿真器崩溃了。所以我回到我的 IT 柜,尽我所能模仿福尔摩斯,最后耸耸肩,然后……重新启动。目前可以正常工作。

周六早上我醒来发现没有远程连接。我开车去办公室,发现整个机架都关机了。现在我有一个新的 UPS,但从未将其连接到服务器。办公室里没有其他东西关闭,只有机架。所以我检查了 UPS,它只是关闭了,完全关闭了。现在我实际上并不认为这有关系,因为 UPS 与网络中的任何其他设备都没有数据连接,但这是一个奇怪的事件,我想我会提到,以防有人认为这是其他问题的症状。所以我启动了服务器,剩下的时间一切都很好。连接稳定,没有问题。截至本文发布时,电力已稳定 3 天,而且还在继续。

星期天早上,我的 Linux 登录速度非常慢,用户名和密码之间有 10 秒的延迟。我心里一沉……所以我远程桌面进入办公室检查一些设置,令我惊讶的是,我无法从本地网络访问服务器。我可以远程登录(SSH/Telnet),但与服务器的本地网络连接已断开。

我上周一到达时发现什么都没有改变。我仍然无法通过本地网络访问服务器。没有 ping、没有 http、没有终端仿真器……什么都没有。所以我开始深入研究路由器,发现服务器列在连接的设备中。因此,路由器可以看到服务器,但它不是在本地路由连接,而是远程路由。我觉得这是一个重要线索,但我不知道为什么。

我最终崩溃了,打电话给 NetGear 技术支持。可以说,这完全没用。所以我决定自己做一些改变,只是为了消除可能的薄弱环节。我绕过交换机,将服务器直接连接到路由器。我为服务器保留了本地地址以避免 IP 冲突。我甚至取消了 DHCP 分配该范围内的任何 IP 地址,但仍然没有任何帮助。

我注意到的一件事是,在一小时或更长时间不活动的情况下,连接似乎会断开。我不能确定这是否是相关性或因果关系,但这让我很好奇。我的第一个想法是网卡要休眠了,但服务器没有任何电源管理软件,当然这不支持它仍然可以远程访问的事实。所以我仍然倾向于认为这是一个路由器问题,因为这是唯一一个没有被绕过或更换的新硬件。在切换之前,其他一切都正常。

有些人会建议我更换路由器。这当然是我最后的选择,但我要为自己辩解,路由器是全新的,虽然这并不排除它有缺陷,但这种情况似乎不太可能发生。但当然,整个问题似乎也不太可能发生……我确实有一个旧的 Linksys 路由器,我试图用它来代替 Netgear,但那东西简直糟透了。在设置过程中,我甚至有一半的时间都无法连接到它。我不是来贬低 Linksys 的,但该死的 Belkin……

总之,服务器经常断开与路由器的连接(反之亦然),但仅限于本地网络,通过 SSH/Telnet 进行远程访问,尽管有些奇怪的行为。在这些中断期间,电子邮件服务器根本无法工作。重新启动服务器是目前唯一能解决问题的方法。

以下是我的设置的一些细节

路由器:全新 NetGear Nighthawk AC1750、R6700v3,端口 22 根据供应商软件要求转发 交换机:JGS524 IP:Frontier FIOS,静态 IP 网络:点对点,Windows 10、7 和 Linux Redhat Server

如果你已经读到这里,谢谢你对一个人的问题感兴趣。我感谢你对这个问题做出的任何贡献。

相关内容