V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mekingname
V2EX  ›  问与答

大家在使用大模型总结大量文本时,如何防止张冠李戴

  •  
  •   mekingname · 15 天前 · 676 次点击

    目前有个工作任务,需要每天总结 3000 封邮件,生成一封 500 字的日报并发给老板。

    我发现在实践过程中,如果邮件本身就是日报形式的,非常容易出现张冠李戴的问题。

    举个例子,其中一封邮件的内容:

    张三今日完成工作如下:优化 XX 项目后端延迟,与 YY 供应商签订合作协议
    李四今日完成工作如下:与 xx 公司达成战略合作协议
    

    大模型在总结后生成的内容,可能会出现张三与 xx 公司达成战略合作协议。我分别测试了 GPT-5 、Claude-Sonnet-4.5 、Kimi k2 、Gemini-2.5-pro,都会出现这个问题。

    3000 封邮件大概会有 10 几万字,因为里面可能会有很长的研报。我是每 50 封邮件总结一次。最后把 60 次总结再进一步合并总结。

    我的 Prompt 写得非常详细,已经明确要求把公司和事实一一对应了,但依然会出现这个问题。

    大家对这种问题有没有什么好办法。各种方案我都试过了,prompt 已经优化得不能再优化了。这种问题还是会出现。

    4 条回复    2025-11-05 14:33:43 +08:00
    NQ
        1
    NQ  
       15 天前 via Android
    用 claude 这种现象会少很多
    Maboroshii
        2
    Maboroshii  
       15 天前 via Android
    这种问题挺痛的,也就是说 ai 总结了以后无论如何还是要自己检查一遍,那工作量并不少
    mekingname
        3
    mekingname  
    OP
       15 天前
    @Maboroshii 我打算放弃直接基于文本来总结了。

    先基于文本提取实体和事实,生成 json 。

    然后基于 json 生成最终的总结。
    WithoutSugarMiao
        4
    WithoutSugarMiao  
       15 天前
    把具体 prompt 发出来看看吧。感觉 50 封总结一次 也还好吧,不行降低一下 30 封总结一次呢?
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   922 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 20:17 · PVG 04:17 · LAX 12:17 · JFK 15:17
    ♥ Do have faith in what you're doing.