我遇到了一个奇怪的连接问题,只有一台服务器,我不知道如何诊断。基本上,我正在使用 iRedMail 设置自托管电子邮件服务,一切运行正常一段时间,然后:
- 所有 http、https 和 imap 连接停止工作(错误为超时或连接被拒绝)
- 当一台客户端机器出现故障时,同一本地网络(远离服务器)上的所有其他机器也会开始出现故障
- 当处于故障状态时,其他所有站点均正常运行
- 如果我重新启动本地路由器(它也会重新建立与 ISP 的连接并获取新的 IP 地址)一切都会重新开始正常工作。
- 如果我将手机从 wifi(失败的网络)切换到 4G,手机就可以开始工作。切换回 wifi 后,手机又会失败。
- wget 从远程邮件服务器到自身,有效
- wget 从不同的远程服务器到邮件服务器有效
- 重新启动服务器无法解决问题
- 如果我不重置本地路由器,大约 8 小时后它就会重新开始工作
- 我已经多次重新安装了服务器操作系统和软件
- 我也曾见过它在 4G 上失败,但大约一小时后它又开始工作了
- 当处于失败状态时,服务器 nginx 访问和错误日志不会显示任何活动
- 从 Outlook for iOS 连接到服务器似乎立即中断
- 该问题不会影响 SSH 或 PING
- DNS 查询工作正常
- 该服务器是 4GB 共享 Linode,配备 Ubuntu 20.04 LTS 和最新的 iRedMail。
我会联系我的 ISP,但正如我提到的,我也通过 4G(即不同的 ISP)见过这种情况(仅一次)。就好像服务器返回了一些格式错误的数据,导致这里和服务器之间的管道出现问题。
基本上我被难住了,所以任何线索都会非常感激。我该如何诊断?我还能尝试什么?
更新:我已经在另一个数据中心(悉尼,和我所在的城市)重新创建了完全相同的 Linode,所有这些问题似乎都消失了。真奇怪。