系统错误日志疯狂刷新,我该如何优化

2023-10-25 11:33:58 +08:00
 clacf1

十几个应用组成的业务系统,每个应用都疯狂打 error 日志,一天加一起能有 17w 个。领导让我提高稳定性,降低这些日志数量,消除对系统有影响的风险。然后我提了一百多个 bug 单,开发的意思,大部分是参数校验报错,要么就是配置问题,导致空指针。也不给处理,现在已经一团乱麻了。

我想问下各位运维开发大佬,针对这种情况,我该如何处理,我现在能想到的方案:

  1. bug 单如果没有影响, 开发需要把包装日志,提供一个错误码,我好过滤,不能简单的给我打回来。
  2. 日志中心那边改造下,需要能够通过错误码筛选,当前只有四个级别可供选择
  3. 我可以要求他们把参数校验报错,改成 warn 的日志级别吗? 不知道这种该不该算是 error 的错误。
864 次点击
所在节点    问与答
7 条回复
yidinghe
2023-10-25 11:47:39 +08:00
既然业务开发人员有能力辨别一条错误日志需不需要处理,那对于不需要处理的情况,就不要打日志了
sujin190
2023-10-25 12:05:20 +08:00
参数校验既然不是错误为啥要写错误日志,空指针异常报错居然不是 bug 真是。。你们这测试真可有够严谨的,正常的应用不都是上线不允许有 errror 级别日志,否则监控系统直接报异常

error 级别日志输出一般应该包含两种,一是硬件或系统非预期异常,第二种就是不在设计业务流程的非预期异常,参数校验校验本来就属于业务流程一部分的而且也需要测试,所以应该属于符合业务流程且在预期内的异常,顶多算个 waring 吧
8355
2023-10-25 12:10:32 +08:00
开发垃圾啊。。。没得救
silentsky
2023-10-25 12:22:22 +08:00
@yidinghe 这种开发可以开了 有意义的异常才打出来也有利于监控
julyclyde
2023-10-25 12:33:45 +08:00
error 级别的日志是不是 error 内容呢?
如果是的话,那你摊上大事了
如果不是,先整改吧
julyclyde
2023-10-25 12:35:50 +08:00
第二点估计是不可能的
根据错误码筛选,相当于你让日志中心针对你这个错误的日志源做定制开发,背离行业规范

第三点那是调用方的问题啊,让调用方整改;被调方出个 error 或者 warn 我觉得都不算什么问题
日志的用途是发现问题,不是掩盖问题
potatowish
2023-10-25 13:05:08 +08:00
见过一些开发,参数检验他也抛个异常出来,打印一堆异常栈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/985207

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX