POE 交换机经常自动重启

环境:
交换机型号:USW-8P-150
连接:1-3 口分别连接三个 AP ,并通过 POE 为 AP 供电。8 口连接上级交换机。

问题:
最近几个月偶尔(一周一两次到两周一次)会有人在早晨抱怨无线无法上网,但网线可以上网。
但这个问题无需解决,一般等个半个小时左右无线网络的互联网连接会自动恢复。

检查:
检查控制台事件,发现交换机和 AP 经常在凌晨和周末丢失连接,详细见图。1575267829179

尝试解决:
因为断开连接只会发生在周末和晚上,我初步判断是物业对强电的操作或维护产生的浪涌导致 POE 供电有问题,查了下英文的论坛,似乎也有人汇报类似的问题。
然后我就把这台交换机连到机房的 UPS 上,但今天(周一)发现周末还是发生了几次断开连接。

现在我怀疑可能是设备出现问题,联系卖家,卖家说可以寄回去检测。但我这寄回去公司就没无线网络可以用了。所以我想在我寄回设备之前,我想先在论坛上问问大家有没有遇到过类似的问题,是怎么解决的?

在上面的描述中,您的判断是交换机重启了?在设备列表界面里有交换机的上电运行时间的,也可以对应你的AP离线时间,看到是不是真的断电了,还是重启了。
因为您现在已经连接了UPS,按说是不会断电了,那么如果到早上看到交换机的上电运行时间小于一天的就可以判定交换机重启了,否则只是AP被离线了。这是两个问题的解决方向,还请确认一下。

再敷述一下:界面上的disconnect仅仅是指设备按时上报到AC的状态报文AC端没收到,所以这个时间段里从AP到AC的整个路径上都可能是问题嫌疑点。

建议操作,把快速漫游、智能AI、5G优先、无线上联这些可能有副作用的高级功能关闭掉。交换机上的STP也关一下……

UBNT-US.v4.0.69# info

Model:       USW-8P-150
Version:     4.0.69.10871
MAC Address: b4:fb:e4:b0:b8:51
IP Address:  172.16.11.239
Hostname:    UBNT
Uptime:      453121 seconds

Status:      Connected (http://172.16.10.99:8080/inform)

算下来时间是 5 天多,应该是我上次重启的时间。
我在设备上查询日志 /var/log/messages 发现只有从今天早上 10 点 20 开始的信息

Dec  2 10:20:42 UBNT daemon.info switch: DOT1S: Port (8) inst(0) role changing from ROLE_DESIGNATED to ROLE_DISABLED
Dec  2 10:20:44 UBNT daemon.notice switch: TRAPMGR: Link Up: 0/8

这是提示连接上级路由的端口 down 了。这次断的时候我还没有关闭这个端口的 POE,我现在已经把这个端口的 POE 设置为关闭了,我再观察一下是不是还有问题。

还有,我怎么设置日志保存期限?我想多保存一点日志,怎么设置呢?

看上去交换机并没有重启,仅仅是上联端口断开了;

日志交换机本机存不了太多的,都是上报的,上报的部分在AC里可以设定无限存的,在AC上可以从insight里查看的,一次6000条吧,还可以再向前加载更旧的记录

感谢,我明天试试在 AC 上改下日志设置,我好像还看到了一个设置远程 rsyslog 服务器的地方,我觉得我可以试一下。
我今天关闭了上联口的 POE 还换了一根网线,希望不会再出现丢失连接的问题。

还想再请教一个问题,就是如果 AC 离线(比如安装软件的服务器关机了)应该不会影响网络的正常使用吧?

建议操作,把快速漫游、智能AI、5G优先、无线上联这些可能有副作用的高级功能关闭掉。交换机上的STP也关一下……

这里面提到的功能如果开启了,是不是在 AC 离线时会造成网络无法使用?

这些功能即便AC在线也一样会影响你的网络,不确定自己有必须的功能尽量不开,保持配置最小集合;高级功能或多或少都是有副作用的,你在不理解不清楚的情况下都点选上后,对你来说剩下的都是副作用罢了……「所以高级功能上都有黄色的警示标签提醒你」

问题已经解决,在控制台上关闭了连接上层交换机端口的 POE 供电并更换一根网线之后,已经稳定运行两周了。

现在我不确定到底是 POE 供电设置还是网线的质量问题。但我也不想再花时间去测试了。

后面如果有谁遇到类似的问题,可以按照我这样做一下试试看。

1赞