目前有个工作任务,需要每天总结 3000 封邮件,生成一封 500 字的日报并发给老板。
我发现在实践过程中,如果邮件本身就是日报形式的,非常容易出现张冠李戴的问题。
举个例子,其中一封邮件的内容:
张三今日完成工作如下:优化 XX 项目后端延迟,与 YY 供应商签订合作协议
李四今日完成工作如下:与 xx 公司达成战略合作协议
大模型在总结后生成的内容,可能会出现张三与 xx 公司达成战略合作协议。我分别测试了 GPT-5 、Claude-Sonnet-4.5 、Kimi k2 、Gemini-2.5-pro,都会出现这个问题。
3000 封邮件大概会有 10 几万字,因为里面可能会有很长的研报。我是每 50 封邮件总结一次。最后把 60 次总结再进一步合并总结。
我的 Prompt 写得非常详细,已经明确要求把公司和事实一一对应了,但依然会出现这个问题。
大家对这种问题有没有什么好办法。各种方案我都试过了,prompt 已经优化得不能再优化了。这种问题还是会出现。
1
NQ 15 天前 via Android
用 claude 这种现象会少很多
|
2
Maboroshii 15 天前 via Android
这种问题挺痛的,也就是说 ai 总结了以后无论如何还是要自己检查一遍,那工作量并不少
|
3
mekingname OP |
4
WithoutSugarMiao 15 天前
把具体 prompt 发出来看看吧。感觉 50 封总结一次 也还好吧,不行降低一下 30 封总结一次呢?
|