V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
snoBall
V2EX  ›  问与答

有人拿过自己的微信聊天记录训练大模型吗?

  •  
  •   snoBall · 48 天前 · 871 次点击
    这是一个创建于 48 天前的主题,其中的信息可能已经有所发展或是发生改变。
    类似于这个项目里面的:
    https://github.com/LC044/WeChatMsg
    想玩一玩,但用运算力有可能造成隐私泄露,所以想问一下大概什么性能的机器能本地训练?
    3 条回复    2024-11-12 09:35:47 +08:00
    snoBall
        1
    snoBall  
    OP
       48 天前 via Android
    真的没有人试过吗........
    Volekingsg
        2
    Volekingsg  
       48 天前
    因为这种少量(相对预训练)数据怎么通过训练让 LLM 记住且会利用,还不丢失原有能力是件比较困难的事情。不是简单的 CPT 或者 SFT 就可以的
    pianjiao
        3
    pianjiao  
       48 天前
    好像在哪里看见过有人用聊天记录训练 本地模型然后对话的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5724 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 103ms · UTC 02:00 · PVG 10:00 · LAX 18:00 · JFK 21:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.