大语言模型训练请教

266 天前
 cookgo
1558 次点击
所在节点    程序员
8 条回复
makejohn2015
266 天前
不用从零开始找数据训练,可以找网上现有的法律对话、问答的东西,写个脚本疯狂问,用来训练你的“机器人”,知识蒸馏。
sentinelK
266 天前
有几个问题需要先明确。

1 、是从 0 开始模型训练?还是模型微调?还是只是注入上下文信息?
2 、对信息的准确度要求如何?
3 、你想付出多少成本?
imes
266 天前
1. 不管什么方法,弄到至少 100G 的法律资料。
2. 找 3-5 个 5 年以上经验,不同方向的律师,让他们把上述内容分类整理。
3. 买至少 4 张 H100 以上的卡,初期可以在 llama2 的基础上,使用 LoRA 进行微调。后期至少需要 3 台英伟达 DGX 服务器。
4. 找至少 20 位律师(不要求经验),对输出进行 ground truth 核对。
vivisidea
266 天前
你是否在找 https://github.com/PKU-YuanGroup/ChatLaw?tab=readme-ov-file

自己搞投入有点大的,我是建议用业界最强 gpt4 试试
fulajickhz
266 天前
现在的 AI ,无论中外,只要能搜互联网的,都可以满足你的要求

你自己试试就知道了

官方的,税务总局的机器人客服有类似的功能,通过关键词会触发对应的条例和具体条款

其他部门的没碰到过
Alias4ck
266 天前
阿里有一个法律的 通义法睿 https://tongyi.aliyun.com/farui/chat
cookgo
261 天前
@makejohn2015 这种方式是指的《模型微调》吗?
cookgo
261 天前
@sentinelK 对信息的准确要尽可能的高,因此应该是要从 0 开始训练模型了吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1017957

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX