有没有大佬帮分析下这离奇的 bug。

202 天前
 xzg1993

感谢你点开这个帖子,谢谢大佬,花费五分钟看这个问题。

1.情景题要: 公司内部做了四台打卡机,部署在不同食堂,走公司内网环境,在线打卡。

2.现在出现问题: 其中三台打卡机,会偶发性的出现打卡超时。比如打卡的时候,前几个一切顺畅,打着打着就出现打卡超时。

3.服务器配置: 刚开始使用 3 个 docker ,后续排查原因时候,关停两个 docker ,只使用一个,依然有该问题。

4.已经使用处理方法: 查看前后端代码,检查是否有问题,已经确认打卡接口很简单,只有一个加密传递,对比 redis ,插入数据库打卡数据。

5.刚检查日志发现: 能正常在线打卡的机器,传递的数据无重复,偶发性打卡超时的机器,发现会在短时间内调用多次接口。

6.目前推测: 6.1 打卡机器的硬件问题,所以偶发性的会同时调用多次打卡接口?但是打卡机器四台坏三台,概率太大了吧? 6.2 网络问题,因为在四个不同地方,所以网络信号不一致,导致的?找运维同事从交换机 ping 打卡机,很稳定。 6.3 服务器 docker 配置?这个情况也不应该,因为有一台机器是正常在线打卡的。

7.这个是打卡异常的后端日志:

2024-05-30 08:05:33.881[http-nio-9011-exec-4][INFO ][c.m.dining.config.WebRequestAspect:42] - [Args]: [DeviceClockV2Request(timePeriod=AM, deviceNo=1a25d4348ce19d08, payType=1, name=白 xx, userId=f40f09625cfc9a8ec0cb0dd6dc7b88e5, company=xxxX(集团)有限公司, depart=新能源部, clockTime=2024-05-30 08:05:32)]





2024-05-30 08:05:35.062[http-nio-9011-exec-9][INFO ][c.m.dining.config.WebRequestAspect:42] - [Args]: [DeviceClockV2Request(timePeriod=AM, deviceNo=1a25d4348ce19d08, payType=1, name=白 xx, userId=f40f09625cfc9a8ec0cb0dd6dc7b88e5, company=xxxX(集团)有限公司, depart=新能源部, clockTime=2024-05-30 08:05:26)]


1012 次点击
所在节点    问与答
8 条回复
fkname
202 天前
给点思路,先确认是客户端还是服务端的原因,客户端看下正常和异常的机器在打卡频率和时间上有没有什么差异,或者交换机器位置测试。服务端就监控资源,定期 dump 内存或线程信息分析下。
7911364440
202 天前
多加日志看看具体是卡在哪个环节
bocharud
202 天前
我的调试建议:

1. 服务端打卡接口强制设置 5 秒阻塞, 然后观察客户端行为
2. 检查客户端是否出现了野指针等情况, 或尽量降低请求包体大小(例如去掉不必要的请求头)
3. 将客户端请求的超时设置为 1 秒, 然后观察服务端行为.
uog
202 天前
感觉是网络的问题啊
codersun123
202 天前
先在客户端上加日志,看看这个多发的信息流程是怎么跑进去的
fisherman0459
202 天前
调换一下打卡机位置观察下
vaynecv
202 天前
有没有可能是客户端弱网环境引发的重试😅
1 、服务端接口超时时间设置长一点
2 、接口针对每人每天打卡记录做唯一限制,或者不限制也可以,每次更新打卡时间
猜测跟服务端可能关系不大
rrfeng
202 天前
信息太少,盲猜无线不行。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1047632

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX