背景:公司的某项业务,程序可以正常执行,但是执行结果不对,得到的数据不全。
排查方式:看了遍代码逻辑,没有明显的逻辑问题,看了眼处理后的数据库中数据,除了不全以外没有问题,要同步过来的数据也都是符合要求的。
问题:像这种的问题,应该如何排查比较好。涉及公司业务,说的有点含糊,大佬们见谅。
1
liprais 2023-12-26 15:39:39 +08:00
用 left join 不用 inner join
|
3
gzq1989891 2023-12-26 16:56:44 +08:00
部署链路跟踪,增加业务处理日志。
|
4
AntiFraud 2023-12-26 17:15:19 +08:00 1
笨方法,增加若干日志,一路追踪数据变化。
|
5
helloeather 2023-12-26 17:36:34 +08:00
大胆猜测,打日志验证
|
6
connor123 2023-12-26 17:54:41 +08:00 1
看到大家都是打日志我就放心了
|
7
Light3 2023-12-26 17:57:07 +08:00
往 txt 里面写返回呗
这也能报错的吗? |
8
winglight2016 2023-12-26 17:57:16 +08:00
全链路跟踪都没有吗? java 是最容易实现的了
|
9
nice2cu 2023-12-26 19:55:37 +08:00 1
打日志+1
|
10
a582102953 2023-12-26 19:57:33 +08:00
打日志观察数据,这个没有别的办法
|
11
zapper 2023-12-26 20:30:08 +08:00
可能原始数据存在特殊数据处理异常丢弃了
不懂你什么语言。是不是内存不够申请失败丢了一些数据,监控一下机器状态 数据处理太久丢弃后续了。看全链路检测那个方法耗时太多 大杀器:打日志 |
12
mxw0204 2023-12-27 11:43:59 +08:00
传个 arthas 上去?
|
15
xianxia OP @winglight2016 大佬,有可以参考的博客或文档吗
|
16
LiaoMatt 2023-12-27 14:37:41 +08:00
Java 项目的话, arthas 运行时切入程序, 观察参数和返回值
|
17
winglight2016 2023-12-27 15:24:29 +08:00
@xianxia 看你的运行环境吧,我们在阿里云的 k8s 上,有 SLS 上的 trace 服务,直接外挂在 pod 上,日志详细到方法级,不需要改代码。
其他环境应该也是类似,运行命令,设置 agent ,开源的库应该也有 |
18
imokkkk 2023-12-27 16:43:56 +08:00
远程 debug 或者 arthas
|
20
xianxia OP |
21
imokkkk 2023-12-28 09:36:25 +08:00
@xianxia #19 网上很多教程的 类似这种 https://blog.csdn.net/weixin_45565886/article/details/126662703
不过 debug 过程中断点一样会阻塞线上应用 记得提前把 debug 的节点从流量中摘出来 |