聊天机器人,如何训练?

20 天前
 mfsw

如题,喂他几本书,然后在给她一些资料, 怎么根据这些资料, 能训练出高质量的聊天机器人呢?

871 次点击
所在节点    OpenAI
7 条回复
musi
20 天前
几本书就想高质量?那也不用 Scaling Law 了
kaichen
20 天前
大力出奇迹,几本书是不够,要很多很多。

参考,推理能力超过 gpt-3.5 的 Llama3

- https://ai.meta.com/blog/meta-llama-3/
- https://ai.meta.com/blog/meta-llama-3-1/

> Meta reports on Llama 3.1's page on Huggingface, using 39.3 million hours of H100 80GB instances to train all 3.1 models (8, 70, 400 B).

大概是,两万四千张 H100 训练 74 天

> Llama 3 is pretrained on over 15T tokens that were all collected from publicly available sources.

大概等同于 60TB 数据,在它的技术报告里,提到这是更大的数据集上做清洗去重的精华

---

所以先有这么多的资源才能训练得到高质量机器人
lneoi
20 天前
想做机器人客服还是什么?现在基础模型这么多,为啥要重头搞一个
mfsw
20 天前
@musi
@kaichen
@lneoi
感谢诸位大佬指点。
我的想法是,利用现有的 ai/模型,加入一些干预,比如喂它一些书籍资料等,形成自己风格的聊天机器人,使得更好的完成我的需求。其实就是个性化。
请诸位大佬继续赐教。
musi
19 天前
@mfsw #4 那就用 RAG ,但是想把 RAG 做成可用状态需要花大量时间精力,如果能把检索做好的话,你可以做一个 perplexity 出来了。这是一家估值 30 亿美元的公司,正准备将估值翻到 80 亿美元,你考虑一下你能不能 cover 住
aiqinxuancai
19 天前
参考 lobechat 的知识库,将书内容量化作为知识库,再写个 prompt 即可
mfsw
19 天前
@musi 想想吧,哈哈。

@aiqinxuancai 这个应该是挺符合我的需求的。感谢指点。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1084096

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX