想利用大模型搭建企业内部的问答系统,但关于「公司项目代码」的问题,如何处理

114 天前
 ahjiangwu

问题描述:准备搭一套企业内部问答系统,其中包含研发团队中通用的组件使用的问题,因此一方面需要把相关组件的使用手册收录到知识库中,另一方面希望能直接把相关代码喂给大模型,这样在回答相关问题时能给出些示例

诉求:计划在公司搭一套大模型的对话平台,回答企业内部员工的问题
使用群体:公司员工
知识库内容:

方案:

以上知识库的搭建基本能满足非研发相关的问题咨询,但是关于研发相关的,效果可能不好,因此该如何处理代码相关的问答,能否通过 RAG 来实现,是否需要 Fine-tuning ?

各位有没有过类似的实战经验,或者提供些关键词,方便我了解下

1249 次点击
所在节点    问与答
9 条回复
LuckyLauncher
114 天前
现在 RAG 的准确度基本都不高,导致大模型幻觉还是很严重,你可以试试,效果应该不会很理想
liprais
114 天前
这个事只会给你惹一身骚,不会有别的结果
ahjiangwu
114 天前
@LuckyLauncher 是的,所以现在没有很好的思路,不知道该如何下手,按照我自己的理解,纯 rag 应该不咋样,代码库的向量化也不知该如何做
ahjiangwu
114 天前
@liprais 倒不是组织任务,只是想探索性的尝试
Clannad0708
114 天前
最近在搭建 kubelfow+milvus 。调研搭了一套,倒是没有实际使用情况。蹲蹲楼主后续技术选型,怎么实现的模型训练与 AI 的一整套流程
targz
114 天前
使用群体是公司内部的话,可以玩,但是要少玩
yinmin
114 天前
( 1 )你需要微调大模型,而不是 rag
( 2 ) 8B 是玩具,需要至少 50B 以上的参数
( 3 )大模型会幻想,回答有误导致的问题,锅一个一个甩过来,OP 能接住吗?
mwuxlcanrh
114 天前
要明确自己这个机器人的边界是啥,初期最好聚焦 1-2 个功能点,使用 prompt 进行问题的识别与拆解。

llm 不是一颗万能的银弹,好的 robot 背后需要非常大的工程开发。先从小功能做起吧。
ahjiangwu
113 天前
@yinmin 感谢分享
被甩锅倒是还好,用 8b 只是不太想申请太多硬件资源,关于代码作为数据的微调有没有实践经验可以分享一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1067886

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX