聊天机器人,如何训练?

如题,喂他几本书,然后在给她一些资料, 怎么根据这些资料, 能训练出高质量的聊天机器人呢?

musi

2024 年 10 月 28 日

几本书就想高质量？那也不用 Scaling Law 了

kaichen

2024 年 10 月 28 日

大力出奇迹，几本书是不够，要很多很多。

参考，推理能力超过 gpt-3.5 的 Llama3

- https://ai.meta.com/blog/meta-llama-3/
- https://ai.meta.com/blog/meta-llama-3-1/

> Meta reports on Llama 3.1's page on Huggingface, using 39.3 million hours of H100 80GB instances to train all 3.1 models (8, 70, 400 B).

大概是，两万四千张 H100 训练 74 天

> Llama 3 is pretrained on over 15T tokens that were all collected from publicly available sources.

大概等同于 60TB 数据，在它的技术报告里，提到这是更大的数据集上做清洗去重的精华

---

所以先有这么多的资源才能训练得到高质量机器人

lneoi

2024 年 10 月 28 日

想做机器人客服还是什么？现在基础模型这么多，为啥要重头搞一个

mfsw

2024 年 10 月 28 日

@musi
@kaichen
@lneoi
感谢诸位大佬指点。
我的想法是，利用现有的 ai/模型，加入一些干预，比如喂它一些书籍资料等，形成自己风格的聊天机器人，使得更好的完成我的需求。其实就是个性化。
请诸位大佬继续赐教。

musi

2024 年 10 月 29 日

@mfsw #4 那就用 RAG ，但是想把 RAG 做成可用状态需要花大量时间精力，如果能把检索做好的话，你可以做一个 perplexity 出来了。这是一家估值 30 亿美元的公司，正准备将估值翻到 80 亿美元，你考虑一下你能不能 cover 住

aiqinxuancai

2024 年 10 月 29 日

参考 lobechat 的知识库，将书内容量化作为知识库，再写个 prompt 即可

mfsw

2024 年 10 月 29 日

@musi 想想吧，哈哈。

@aiqinxuancai 这个应该是挺符合我的需求的。感谢指点。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1084096

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.