U6-LR间歇性断网

问题现象:wifi终端信号满格,偶尔无法通互联网,此时在UnifiController页面可以看到AP的断网设备得分变为60%左右,如下图。同时,断网终端尝试ping网关路由器会超时。UC页面没有告警。且出现此问题时,并非所有终端都断网。什么都不做,断网终端过一会儿又可以上网,UC页面显示得分98%左右。

网络拓扑:
RouterOS - 主交换机 - AP(U6-LR) - 终端设备

软件版本:
AP和UC均是当前最新版本。
U6-LR固件版本5.43.23.12533
UC版本6.1.71

其它配置:
image

其它说明:
论坛检索过相似问题,做了如下尝试,问题还是存在。
1.关闭主交换机的生成树协议。
2.关闭上行链路监控。
3.官方指导通过指标排除wifi故障,最新UC版本没找到这个页面。

求指导该问题定位思路

可能性比较多,自己在终端侧用工具长ping网关、AP、交换机及网内平级的PC终端;「尽量不要等到出问题的时候才开启ping,此时如果网关没响应了,ARP都得不到回应的,那么所有的测试都是废的」
有条件的可以从内网侧找个固定PC倒ping这几个参考点。

观察问题出现的时候,这几个参照点的反馈时间是否有不一样的变化;

可以想得到的有:

1.统一无响应,则AP和终端侧应该被屏蔽了,查STP和网关的控制机制及网关性能问题;
2.仅网关无响应或响应ping值降低则怀疑是网关问题;

PS:个人建议把二级路由和爬墙工具都撤掉,MVP原则只留一个AP、一个交换机、一个路由器就能知道问题所在了。大多数就是引入这些额外的装备造成的。 :crazy_face:

如果怀疑是AP固件的问题,出问题的时候可以试着直接关闭终端Wi-Fi,再立即打开触发断联和重新关联两个动作,这样可以快速恢复的可以怀疑固件断流问题。

这玩意比较新,建议更新固件再试试

首先,感谢答复。

UC上拓扑图的展示上是有点问题的,可能因为路由不是Ubnt的吧。主路由是ROS,OpenWrt作为旁路爬墙网关只有指定设备感知,其它设备的网关都是ROS。使用不同网关的终端都出现过此问题,且仅限无线终端。再考虑到之前是用的网件R7800作为AP的,其它设备不变并没有问题,因此考虑还是U6-LR的问题或者是哪里的配置不对。

另外,之前在主交换机上关闭生成树协议,后来我发现每个端口有个覆盖配置,默认也是开启生成树的(见下图,藏得沉啊)…然后我把所有端口的都逐个单独关闭之后,发现这个问题的频率变得极低了。以前一天数不清多少次,现在两三天了只遇到一次。准备再观察几天看看,当前问题频率还是可以接受的,毕竟可以自动恢复,况且实在也不好在iphone上长ping诊断…

image
image

那就还是原来说的STP导致的,没排除干净。

不过清除STP是比较麻烦的,因为网内任何一个设备开了就会影响到全局,因此发生频率低了,说明网内还有什么设备开着比如路由、网关、交换、一些传输服务都有可能的,需要出问题的时候观察触发条件和路径来推测源头了。

PS:有些厂家的某些交换机的STP协议是无法关闭的……是一种自保行为「保证我不死,你们死不死能不能用不管我事儿 :joy:」,换位思考也算能理解吧……

目前组网里的网络设备,只有主路由RouterOS,旁路网关OpenWrt,交换机2个都是Ubnt的,只有主交换机支持STP。如前所述,之前用其它设备作为AP,没有这个问题,U6-LR到货后才刚替换掉原AP,因此考虑还是U6-LR相关问题。

另外,彻底关闭STP后又发现家人的iphone8plus比我的iphone12pro出问题的概率更高,而且UC上看wifi得分正常(但是微信正在连接显示很久),同一个时刻,我的手机并没有问题。这个我只能想到区别是wifi5和wifi6,但wifi5也不至于卡顿啊…射频配置上有啥要注意的么?比如一些什么legacy support之类的?我目前只有1个AP,快速慢游等功能都是关闭的。当前配置如下图

image

image

:sweat_smile:

PS:

这些都关闭了,问题依旧。最近发现一个新现象,如果出现断网问题,打开ping就会立刻恢复,就好像是ping把网路打通了一样。

好像是你点开啥高级功能了吧…… :joy:
看看这个是不是该关掉「会引起你描述的问题 :stuck_out_tongue:」:

没有开这个。暂时没想明白什么原理,只是ping不是ip包而已,下次我再试试只ping ap本身看看会不会立刻恢复应该能判断哪段链路问题。

把主交换机的流控关了,然后两周没有这个问题了:smile:感觉是找到根因了