TCP 延迟高

我家里的网络情况,网关用的是udm,光猫拨号,然后连接一个ap LR。
最近有些设备经常出现 TCP 延迟高。
请问大家,这样的问题怎么排查?

有线延迟高查内网设备,无线延迟高查干扰换信道……
另一方面来说,无线重载情况下存在突发延迟高很正常,无法避免的……不影响体验就好

出现的有:

  1. tcp延迟高
  2. dns延迟高
  3. wifi重传高
  4. dns超时

这都是为啥啊

1和3是同一个问题,因为延迟高了才会导致重传,重传多也就变相导致其他的传输延迟更高;
2和4也是同一个问题,因为延迟高了,才会导致超时;

那么先来看第二个问题类,DNS:
为啥先说DNS?因为这个简单易解 :grinning:
做法非常简单:

  1. 在AC的SETTINGS–》Networks–〉EDIT NETWORK - LAN的页面中把DHCP Name Server设置成Manual,并在后面把线路运营商下发的DNS填进去,再点击SAVE按钮保存;
  2. 在AC设备列表中点击USG或UDM/UDM Pro,选择强制同步配置,把配置强制下发到设备上;

请注意: 上述说的DNS是你用PC直接接光猫二层PPPoE拨号时得到下发的那两个DNS,而不是你想象出来的8.8.8.8或者114.114.114.114这样的通用地址,随时会被Q,结果和现象就是DNS超时和高延迟;
WAN口也可以改手动,作用就是Dashboard的显示会更好看,意义不大,如果强迫症可以WAN和LAN一起改了,再同步到设备上即可。

问题一涉及到的范围太宽了,首先你自己的体验是不是存在真的高了?建议你回退版本到以前自己对比一下,如果问题一样的那就是环境问题,自己按照二楼的操作起来;如果有明显的不同,可能版本上的差异导致的,先留在低版本就好,没必要自己做大白鼠 :grinning:

感谢您的回答。

我有时候还会出现某些设备的Rx/tx 速率突然降低到0或者很低的一个值.实在也不知道是为啥

这个问题已经困扰我很久了。我也寻求了美国的技术支持,关闭了所有UDM的高级选项,到现在还是没有解决。
我的网络结构是UDM 链接 UAP-AC-LR,UDM同时作为主路由, 有一些设备是通过网线链接到UDM。
所有有线链接的设备都没有问题,我从nas上双向ping,很稳定。在UAP-AC-LR和UDM之间互ping,也是稳定的。
但是无线设备不管是链接到UAP-AC-LR还是UDM的时候都会出现一样的问题。设备pingUDM/uap-ac-lr是稳定的。但是UDM/UAP-AC-LR ping 设备端的时候,都会出现ping值不稳定,最大延迟能够到700ms。我同时让两者相互ping也是一样

不是很清楚你想要的是一个什么样的结果才是满意的?
ping本身就是一个连通性测试工具,就是代表两个设备间的网络是否通,一个通讯来回需要的时间值罢了。几乎什么都不能代表……

而把ping放到无线侧测试更加没啥代表意义,因为无线是存在争抢和冲突的,因此别人在传输的时候,你就要等,甚至说别家的AP信号也能覆盖到你家的相同信道的时候,它的AP和它的终端通讯时,你也要等要么就冲突丢包,所以自己无线环境下,AP使用的信道的实时利用率、信噪比、测试终端的握手速度,单个AP下有多少终端都是影响的因素……

我在家的环境下USG3+UAP-AC-SHD,娃的iPad在上网课,我本子无线上开一个快ping到USG得到如下:

Last login: Fri May 8 10:33:24 on console
#sudo ping -i 0.01 10.4.31.2
Password:
PING 10.4.31.2 (10.4.31.2): 56 data bytes
64 bytes from 10.4.31.2: icmp_seq=0 ttl=64 time=3.960 ms
64 bytes from 10.4.31.2: icmp_seq=1 ttl=64 time=2.938 ms
64 bytes from 10.4.31.2: icmp_seq=2 ttl=64 time=1.756 ms
64 bytes from 10.4.31.2: icmp_seq=3 ttl=64 time=2.184 ms
64 bytes from 10.4.31.2: icmp_seq=358 ttl=64 time=1.676 ms
64 bytes from 10.4.31.2: icmp_seq=670 ttl=64 time=1.809 ms
^C
--- 10.4.31.2 ping statistics ---

671 packets transmitted, 671 packets received, 0.0% packet loss

round-trip min/avg/max/stddev = 1.338/2.573/16.462/1.164 ms

可见的数据平均2.573ms好像比你的那个要好很多吧,但是实际无线网络的信号呢,我们来看一下实际数据,我的本子在书房里「回避娃的课堂对话」,AP在客厅里隔一个门:

可以看到其实信号只有-74,SNR只有可怜的21,握手仅264M,不过跑个ping还是很稳的。所以你的环境里这些关键参数到底如何?才能导致这么差呢?
我这个AP的信道选得还不错,测试的时候利用率也比较低:

烦请自己对比一下环境的差异,有条件的换个设备,换个信道,换个位置「AP和终端都需要换」

关于无线握手速度和实际速度的关系可以看我这个帖子里的简介:https://bbs.ui.com.cn/t/uap-ac-iwwifi/51362/2?u=catseye

ping值就是最简单的测试网络连通性的办法。
如果在一个适当的范围内波动,这是正常可以理解的。

但是我的情况是在同一时间内,上下行同时进行ping的截图,上行完全正常(左图),下行的波动从1ms~300ms(右侧),还有到700ms的。这已经是明显的ping值不稳了。如果有干扰,只干扰下行,不干扰上行?而且这个问题同时出现在UDM和UAP-AC-LR上,他们所处不同的楼层,但是同样的测试,同样的结果可以复现。

所以我推测这个大概率情况是UDM在发送/处理下行数据的时候的问题。

这个方法就是因为美国ubnt技术支持要求下做的。

对了,做这个测试的时候,电脑和UDM之间相隔不到1米

仍旧是只有现象没有环境参数……丝毫没有任何助益……

信道?利用率?信号强度?SNR?底噪?握手速率?AP上在线设备数量?

至于说靠近了测试就是好?这个只听说物理上有功率干扰导致近距离测试成绩差的 :crazy_face:
建议测试的时候可以保持4米左右的距离。

朋友,我感谢你的热心回复。
电磁干扰只干扰上行不干扰下行?不合逻辑吧。
至于信道?利用率?信号强度?SNR?底噪?握手速率?AP上在线设备数量?也是一个逻辑,这些在整个网络,家用设备不到20个,2.4g物联网设备单独组网的情况下,也不会只干扰下行不干扰上行。

你的手持终端发射功率小,所以不会有足够的功率干扰到AP,但是AP功率大就不一样了。
我这里前几年有个著名的品牌店铺在丽思卡尔顿,收拾设备的电工也不懂网络,直接把收银、CRM、客用Wi-Fi等4个Ruckus的AP在吊顶上叠了个罗汉,结果就是4个Wi-Fi信号都是满格,但是一个都不能用……客户向多个应用的Vendor报修都解决不了,不得已我带人上门,爬了天花板就觉得好笑,就是把4个AP在吊顶里四向里扔开4米一个,就啥事没有了 :grinning:

前面帖子里是提醒你无线是个系统性应用,任何一个环节都可能影响整体性能,可能是单一原因,也可能是多因素复合出来的效果,想简单的通过一个ping的数据来判断问题所在是基本不现实的,所以才让你补充数据,既然你坚定的认为自己的感觉是正确的,那就当我没说过啥吧 :sweat_smile:

另外,ping的响应包含了上行和下行,并不能简单的看出来到底是上行慢还是下行慢 :wink:

看我下面的截图,都是从我的ac-lite上ping
前两个是只支持2.4G的智能设备,最高延迟也到了400ms,第三个是有线连到us-8-60w上的笔记本,第四个是5G连接的笔记本。
image

我只能说,2.4G现在晚上黄金时间,比较忙吧,楼上邻居channel 1和11的2.4G信号…楼下是两个 channel 1的AP,而且都是40MHz的,这把1,6,11都占了,我也没办法啊…2.4G就是比较挤。