怎么训练一个 bot 深度学习和掌握牛克思哲学理论

248 天前
 necat
假如一个叫牛克思的牛人,发明了一个”牛克思哲学理论“,怎么让 bot 深度学习和掌握它。
是否需要先编撰一本《牛克思思想》,提交到知识库让他引用?
还是以对话 QA 的方式记录为文档,,提交到知识库让他参考?
还是编写一个详细的面向用户的基本手册,提交到知识库让他举一反三?
还有更简单的方法吗?
1195 次点击
所在节点    程序员
6 条回复
yanyao233
248 天前
直接把原文扔数据库应该是成本最低的方式吧,也是现在大部分 rag 的惯用方式,可以先试一下,看看效果怎么样
allplay
248 天前
有意思,要干什么?哈哈
批量生产 D 八股
sullevy
248 天前
基本就是 RAG 的思路了,同时看你用的架构
可能需要要一点的 Embedding 和 ReRank 模型,基础的 LLMs 也不成差。
如果可以 这个牛克思的数据最好也处理下,方便召回
necat
248 天前
@yanyao233 问题是这样,这个牛克思因为是自己刚刚总结的思考,几乎没有任何外部的相关数据和讨论,如果依赖大量的数据只有他自己编写了。如果只能是这样,大概需要多少数据量呢。
necat
248 天前
@allplay 一种探讨,牛克思不一定局限在经济政治方面,利用 bot 的知识库、逻辑思维和举一反三的能力,一旦掌握用途还是很广阔的。
necat
248 天前
@sullevy 是否需要依赖大量的数据,包括作者原文、答疑记录和应用案例,最终的训练结果取决于数据量吗?直接用公开的模型和工具训练是不是不能满足这种要求。重点是在准备数据、还是优化模型、还是最后的训练调试呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1024838

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX