大家在使用大模型总结大量文本时，如何防止张冠李戴

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 87 天前的主题，其中的信息可能已经有所发展或是发生改变。

目前有个工作任务，需要每天总结 3000 封邮件，生成一封 500 字的日报并发给老板。

我发现在实践过程中，如果邮件本身就是日报形式的，非常容易出现张冠李戴的问题。

举个例子，其中一封邮件的内容：

张三今日完成工作如下：优化 XX 项目后端延迟，与 YY 供应商签订合作协议
李四今日完成工作如下：与 xx 公司达成战略合作协议

大模型在总结后生成的内容，可能会出现张三与 xx 公司达成战略合作协议。我分别测试了 GPT-5 、Claude-Sonnet-4.5 、Kimi k2 、Gemini-2.5-pro,都会出现这个问题。

3000 封邮件大概会有 10 几万字，因为里面可能会有很长的研报。我是每 50 封邮件总结一次。最后把 60 次总结再进一步合并总结。

我的 Prompt 写得非常详细，已经明确要求把公司和事实一一对应了，但依然会出现这个问题。

大家对这种问题有没有什么好办法。各种方案我都试过了，prompt 已经优化得不能再优化了。这种问题还是会出现。

4 条回复 • 2025-11-05 14:33:43 +08:00

2025 年 11 月 5 日 via Android

用 claude 这种现象会少很多

Maboroshii

2025 年 11 月 5 日 via Android

这种问题挺痛的，也就是说 ai 总结了以后无论如何还是要自己检查一遍，那工作量并不少

mekingname

2025 年 11 月 5 日

@Maboroshii 我打算放弃直接基于文本来总结了。

先基于文本提取实体和事实，生成 json 。

然后基于 json 生成最终的总结。

WithoutSugarMiao

2025 年 11 月 5 日

把具体 prompt 发出来看看吧。感觉 50 封总结一次也还好吧，不行降低一下 30 封总结一次呢？