公司想搞一个关于 AI 问答的知识库

2023-12-12 09:13:49 +08:00
 hui9000

目前主要有俩需求:

  1. 对于常用知识进行问答,对于公司内部知识(如请假流程,内部代码建议等)可以训练并问答
  2. 可对于目前的内部流程,销售等进行建议;我们公司各个部门内部流程上千。

感觉是需要大模型进行训练,但又苦于不知去哪找到合适的;部署的话可以利用公有云或者私有云都可;(公司内部有私有云) 常识性公开的问答可以用 chatgpt 我这边可以按照 api 进行弄个前端搞,基于 gtp3.5 但是内部流程的话或者销售数据公司领导不想给到外部进行训练。 请问有没有好的方式进行实施,交作业

8547 次点击
所在节点    机器学习
55 条回复
laminux29
2023-12-12 17:20:36 +08:00
楼上那些人都没认真看要求吗?

楼主说了,不希望用公共的 AI ,因为担心公司数据外泄。

这种情况只能选不联网的私有化部署的开源大模型才行。
blessu
2023-12-12 20:36:59 +08:00
微软云的 openai service 不知道能不能用,可以的话就从服务合同的角度避免外泄
em70
2023-12-12 20:58:58 +08:00
@lingxmo #40 只有英伟达不折腾,其他 GPU 也行,就是问题多,得花时间去调试解决
clemente
2023-12-12 23:05:37 +08:00
LLAMA2 完事了
hui9000
2023-12-13 09:08:46 +08:00
@TimePPT 请问这种的话会有本地数据外泄的风险么
crazychang
2023-12-13 10:25:45 +08:00
借贴问问 像这种需求 oa 中大量各种格式文档应该如何处理?
TimePPT
2023-12-13 10:37:06 +08:00
@hui9000 如果直接调取 GPT ,有一定安全合规风险,要求不是很高可以考虑 RAG 完的结果做下脱敏再扔给 GPT ,回复结果里再把脱敏信息还原。
如果安全合规要求很高,保险期间用私有化部署的开源模型也行,可以找下魔改过的对中文友好的 llama2 ,或者国产可以看下 Yi / Baichuan 之类的
TimePPT
2023-12-13 10:39:42 +08:00
@crazychang 格式文档预处理有一些开源框架能做,比如 PDF 、Excel 之类的解析,不过如果长期方案,建议做下归一化处理成结构、半结构化的统一格式做索引——比如 Markdown or json ,这样有其他诉求,上 DB 也方便
大模型自己去解析封装好的格式文档基本不靠谱,GPT 之类的应该也是做了前置解析处理的
blackbookbj277
2023-12-13 14:07:52 +08:00
关注下,同样需求不联网的私有化部署的开源大模型的问答系统,单位工作需要大量的法律、规章制度等内容,如果能不联互联网情况下部署最好了,私有云有 GPU 资源是不是可以用。
hui9000
2023-12-13 14:56:15 +08:00
@blackbookbj277 我稍微研究了几天,也结合了大家的建议,你跟我的需求大致差不多,对于内部知识资料等可以用开源模型搞就行,类似知识库这种上面有;
问答还是交给 chatGPT ;结合两者可以构建应用,也就是所说的基于 api 构建问答系统;
我现在在研究 https://docs.dify.ai/v/zh-hans/getting-started/readme 这个
hui9000
2023-12-13 14:57:15 +08:00
@blackbookbj277 这样成本比较低,如果你那边 gpu 资源够用 就直接全部自己搞
LDa
2023-12-14 10:27:25 +08:00
建议推掉这种活,不要高看公司能给你的数据质量
smalltong02
2024-01-26 08:02:42 +08:00
可以试试这个开源项目: https://github.com/smalltong02/keras-llm-robot
wwhc
2024-02-11 09:13:35 +08:00
不是应该用类似 github.com/imartinez/privateGPT 之类的开源项目么?
guozozo
2024-03-01 17:35:13 +08:00
@hui9000 #50 效果如何?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/999563

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX