V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
qxdo1234
V2EX  ›  问与答

有没有一个还不错的训练自己的大语言模型的方式?

  •  
  •   qxdo1234 · 252 天前 · 943 次点击
    这是一个创建于 252 天前的主题,其中的信息可能已经有所发展或是发生改变。
    自己整理一些资料库,程序尽量使用开源,尽量不使用国内的大语言模型接口。有比较好的推荐方式么?显卡条件的话,租用类似 3080 的显卡, 12G 显存,自己玩,前端页面暂时不考虑,能够实现问问题,返回比较不错的内容就行。形式不考虑,可以自己做。
    4 条回复    2024-04-13 09:42:35 +08:00
    qxdo1234
        1
    qxdo1234  
    OP
       252 天前
    也尽量不用 GPT 这种付费的接口,就自己玩的,用这个接口成本预估比较大。
    shinyzhu
        2
    shinyzhu  
       252 天前
    自己训练还的看数据质量,劝退。还是想想基于大模型做什么应用吧。
    sm1314
        3
    sm1314  
       252 天前
    先看看开源的 chat 模型能不能解决你的问题。不能的话再考虑自己训练,可以使用类似 QLora 量化加速技术,入门就搞搞 SFT ,更进一步就 SFT+PPO/DPO; 由于 scaling law 的存在,7b 及以下模型在量化后性能都比较傻。具体选哪个可以 Huggingface 看榜单,选个排名高的 base 模型作为基座
    7VO54YYGvw3LOF9U
        4
    7VO54YYGvw3LOF9U  
       250 天前 via iPhone
    模型是完完全全的中心化文化产物
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3049 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 13:58 · PVG 21:58 · LAX 05:58 · JFK 08:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.