我正在寻找如何诊断网络问题的帮助(或者如果某些问题很明显,则寻求解决方案的建议)。
我的设置:
提供商:通过 AT&T SIM 卡 (LTE) 提供的移动宽带服务
调制解调器:Mikrotik wAP LTE(美国)//RBwAPR-2nD&R11e-LTE-US
路由器:Ubiquiti EdgeRouter X SFP // ER‑X‑SFP
管理:Unifi Cloud Key // UC‑CK
客户端:无线和有线;Windows、Mac 和 Linux(只有我)
我几乎全天都使用 VPN(wireguard),并且我是 LAN 上唯一一个这样做的人。
我的问题:
在过去 6 个多月里,该网络设置一直运行良好。在过去三周里,全部客户端突然失去连接互联网的能力。这包括有线和无线客户端以及所有操作系统。客户端保持其与 LAN 的租约。
发生时的观察:
- 局域网上的所有客户端都无法浏览互联网,除了我的机器,我的机器在 wireguard VPN 上
- 电子邮件端口/协议似乎运行正常,因为 Mac 用户使用了邮件程序的“故障排除”菜单,并且连接似乎正常
- 我可以在连接到 VPN 时继续浏览互联网
- 但是,当我断开 VPN 连接时:
- 我也无法浏览互联网
- 我仍然可以 ping google.com,因此 DNS 解析似乎不是问题
- curl 似乎表明它正在尝试使用 IPv6 执行某些操作(见下文),但我从未启用或配置调制解调器或路由器以使用 IPv6
当问题出现并且我断开 VPN 连接时,我会使用 curl 来体验它:
-> % curl -v google.com
* Trying 216.58.195.78...
* TCP_NODELAY set
* Trying 2607:f8b0:4005:807::200e...
* TCP_NODELAY set
* Immediate connect fail for 2607:f8b0:4005:807::200e: Network is unreachable
* Trying 2607:f8b0:4005:807::200e...
* TCP_NODELAY set
* Immediate connect fail for 2607:f8b0:4005:807::200e: Network is unreachable
^C
...但我仍然可以 ping google.com
-> % ping google.com
PING google.com (216.58.195.78) 56(84) bytes of data.
64 bytes from sfo07s16-in-f78.1e100.net (216.58.195.78): icmp_seq=1 ttl=111 time=32.2 ms
正常卷曲(没有问题时):
-> % curl -v google.com
* Trying 216.58.194.174...
* TCP_NODELAY set
* Connected to google.com (216.58.194.174) port 80 (#0)
> GET / HTTP/1.1
> Host: google.com
> User-Agent: curl/7.64.0
> Accept: */*
>
< HTTP/1.1 301 Moved Permanently
< Location: http://www.google.com/
< Content-Type: text/html; charset=UTF-8
< Date: Wed, 23 Sep 2020 18:11:24 GMT
< Expires: Fri, 23 Oct 2020 18:11:24 GMT
< Cache-Control: public, max-age=2592000
< Server: gws
< Content-Length: 219
< X-XSS-Protection: 0
< X-Frame-Options: SAMEORIGIN
<
<HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
<TITLE>301 Moved</TITLE></HEAD><BODY>
<H1>301 Moved</H1>
The document has moved
<A HREF="http://www.google.com/">here</A>.
</BODY></HTML>
* Connection #0 to host google.com left intact
我的立即解决办法:
当这种情况发生时,我会通过 ssh 连接到 Mikrotik 调制解调器并重新启动它,这似乎可以使一切恢复正常,但问题可能会在几个小时或几天后再次出现(如果幸运的话)。
显然,不断重启调制解调器并不是一个长久之计。
我并不完全迷恋 Mikrotik RouterOS,因此我试图确定最佳方法来尝试在日志中捕获有关可能导致此问题的原因的更多信息,以便我能够找到更好的长期解决方案。
我的问题:
如果有人知道为什么会发生这种情况,我很乐意听听。
否则,我希望得到建议,在调制解调器和路由器上哪里可以找到有关这些事件的一些日志信息。
有关路由器配置的额外详细信息。几乎全部为默认设置。
$ ip route
default via 192.168.88.1 dev eth4 proto zebra
192.168.1.0/24 dev switch0 proto kernel scope link src 192.168.1.1
192.168.88.0/24 dev eth4 proto kernel scope link src 192.168.88.252
$ show configuration | grep -i ipv6
ipv6-receive-redirects disable
ipv6-src-route disable
有关调制解调器配置的额外详细信息。所有配置均为默认配置(APN 配置除外)。
The following default configuration has been installed on your router:
-------------------------------------------------------------------------------
LTE CPE Router with wireless AP:
* lte interface connected to providers network (WAN port);
* WAN port is protected by firewall and enabled DHCP client
LAN Configuration:
IP address 192.168.88.1/24 is set on bridge (LAN port)
DHCP Server: enabled;
DNS: enabled;
wlan1 Configuration:
mode: ap-bridge;
band: 2ghz-b/g/n;
tx-chains: 0;1;
rx-chains: 0;1;
installation: outdoor;
ht-extension: 20/40mhz-XX;
WAN (gateway) Configuration:
gateway: lte1 ;
ip4 firewall: enabled;
NAT: enabled;
[admin@MikroTik] /interface lte> info lte1 once
pin-status: ok
registration-status: registered
functionality: full
manufacturer: MikroTik
model: R11e-LTE-US
revision: MPSS: R11eL_v12.09.174661 APSS: R11eL_v02.14.174662 CUSTAPP:
current-operator: AT&T
access-technology: Evolved 3G (LTE)
rssi: -71dBm
rsrp: -108dBm
rsrq: -14dB
[admin@MikroTik] /system routerboard> print
routerboard: yes
board-name: wAP R
model: RBwAPR-2nD
serial-number: ************
firmware-type: qca9531L
factory-firmware: 3.41
current-firmware: 6.46.4
upgrade-firmware: 6.46.4
[admin@MikroTik] /interface lte> print
Flags: X - disabled, R - running
0 R name="lte1" mtu=1480 mac-address=**:**:**:**:**:** apn-profiles=att network-mode=gsm,3g,lte
[admin@MikroTik] /interface lte apn> print
Flags: * - default
0 * name="att" apn="broadband" use-peer-dns=yes add-default-route=yes default-route-distance=2
[admin@MikroTik] /ip address> print
Flags: X - disabled, I - invalid, D - dynamic
# ADDRESS NETWORK INTERFACE
0 ;;; defconf
192.168.88.1/24 192.168.88.0 bridge
1 D **.**.**.**/32 **.**.**.** lte1
编辑:
这个 NetworkEngineering 问题似乎描述了类似的情况,但使用了 Fortigate 硬件。