基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

251 天前
 veotax

Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,适合个人或者组织作为自己的专属内部 AI 知识库来使用。GitHub 已达到 1600+ stars ,欢迎体验~

主要功能如下:

在线体验:

源码:

社区反馈:

58659 次点击
所在节点    分享创造
90 条回复
lointo
241 天前
@veotax 嗯 可能有一点点误解 不是对代码的切分 是能够把代码向量化的 向量模型 类似 m3e bge 这类 目前知道的都是收费的. 没有自己本地能够部署的. 这里有个相关的对比 https://huggingface.co/moka-ai/m3e-base#%E2%9A%96%EF%B8%8F-%E6%A8%A1%E5%9E%8B%E5%AF%B9%E6%AF%94
正在调研类似的系统 参考列表
可独立部署:
fastgpt
dify.ai
chatollama
langflow
Flowise
Langchain-Chatchat

在线的
coze
chato
beyondex
241 天前
代码向量化?需要做相似代码片段搜索吗?
Liftman
241 天前
这种实际上的效果。。并不理想。试过类似的。。。而且大部分人连半吊子都不是。很难真的实现效果理想
ohazyi
240 天前
有对比过不同的向量数据库 / 语言模型的效果/性能优劣吗? 比如你说的 m3 bge 什么的
veotax
240 天前
@lointo @ohazyi Casibase 提供了 Embedding Provider 抽象接口,支持各种类型大模型 API 和本地模型的向量化功能。目前实测效果最好的是 OpenAI 的 Embedding V2 以及 V3 模型: https://github.com/casibase/casibase/blob/master/embedding/provider.go
wangxiaoer
239 天前
这种方案有几个问题:

1 基于向量搜索的准确度如何,毕竟最后的答案是需要大模型( GPT )通过向量搜索结果进行二次加工(编造)的。

2 隐私性如何保障:向量搜索结果要作为输入发送给大模型,关注隐私的基本无法用了。
meinjoy
238 天前
国内有个 marvis 和你这个一样吧
QiShine
236 天前
和网易的 Qanything 比较像
ddddd0
236 天前
@Liftman 试试 gptbase.ai 是我用过的精度相对好的产品了
dnsjia
236 天前
@ddddd0 不错,有对应的开源项目么
ffwei107
236 天前
邀请您使用人工智能问答机器人——AI 问答宝:
https://17281.invite.wendabao.net
shiyuu
235 天前
兄弟,知识库要怎么制作啊?我部署了阿里的千问,直接上传一个公司规章制度没有修改过的 word ,根本识别不出来,直接复制文字成 txt 也不识别,更别说其他格式的东西了。
这知识库是不是要有固定的格式???
mio4kon
235 天前
demo 网站怎么上传 pdf 进行测试呢?
veotax
234 天前
@shiyuu 在数据仓库这个页面(比如: https://demo-admin.casibase.com/stores ),点击对应仓库的“刷新向量”这个按钮,Casibase 会对这个仓库对应的“存储提供商”里的所有文件进行向量索引操作,go 后端会有日志输出。还有其他具体问题可以在 Q 群里提问哈,回答会比较快些~
ideaa
232 天前
来试试文心一言+知识库的客服系统吧,可以完全自建
https://www.oamad.cn/
nunterr
230 天前
功能先不说,你们的主页,和聊天的性能可以优化一下😄,太慢了~~
chlinlearn
229 天前
有没有像 kimi 支持在线文章链接总结分析的模型推荐?
Devocy
229 天前
内部实现向量数据库这一点让我很感兴趣。这个资料希望对你有帮助 https://skyzh.github.io/write-you-a-vector-db
ddddd0
228 天前
@dnsjia 应该没开源
lstz
225 天前
我想把此项目集成进项目里,可以吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1022439

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX