V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
veotax
V2EX  ›  分享创造

基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

  •  1
     
  •   veotax · 2024-03-11 10:32:55 +08:00 · 77406 次点击
    这是一个创建于 379 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,适合个人或者组织作为自己的专属内部 AI 知识库来使用。GitHub 已达到 1600+ stars ,欢迎体验~

    主要功能如下:

    • 支持 OpenAI GPT-4 模型、GPT Vision 图片解析、DALL-E 画图等功能;
    • 支持最新的 Claude 3 Opus 、Sonnet 等模型,超越 GPT-4 ;
    • 国际模型支持:Azure OpenAI 、Google Gemini Pro 、HuggingFace 、Cohere 等;
    • 国内模型支持:文心一言、通义千问、ChatGLM 、Minimax 、讯飞星火等;
    • 支持多种 Embedding 嵌入 API 接口,如 OpenAI V3, Ada V2, 百度文心一言等;
    • 支持多种通用文档格式:TXT, Markdown, Docx, PDF 等,支持 PDF 文件智能解析;
    • 支持以会话或消息为单位,计算所有大模型 API 的 Token 数和价格(美元或人民币),方便管理员进行 API 成本统计;
    • 支持 AI 小助手通过右下角弹框嵌入到应用网站,进行在线实时聊天,支持聊天会话人工接入;
    • 知识库文档存储支持本地存储,或云端存储(阿里云 OSS 、Amazon S3 、群晖 NAS 等几乎所有主流云存储都有支持);
    • 支持多用户、多租户,支持管理员进行用户管理、角色管理、权限管理,既适合个人使用,也适合组织使用;
    • 支持 QQ 、微信、企业微信、钉钉、Google 、GitHub 等多种第三方登录,支持短信登录、邮箱验证码登录登;
    • 支持谷歌 reCAPTCHA 、hCaptcha 、阿里云、GEETEST 极验、Cloudflare Turnstile 等多种人机验证方式,专业防盗刷;
    • 聊天会话云端存储,所有设备实时消息同步,随时可查看,不会丢失;
    • 支持中文、英文等在内的十几种界面语言。

    在线体验:

    源码:

    社区反馈:

    110 条回复    2025-03-19 21:47:14 +08:00
    1  2  
    metalvest
        101
    metalvest  
       24 天前
    @zdw189803631 用铜币好像可以把自己的帖子顶上去?
    fofo
        102
    fofo  
       24 天前
    @terranboy RAG 的核心是数据清洗(生成),特定领域的向量模型的微调,目前的开源框架主要都不关注这些。
    SkywalkerJi
        103
    SkywalkerJi  
       21 天前 via Android
    rag 召回数量是有限的,如果内容超过 k 值岂不是一定查不到。
    G64q9J89mN5KSgmE
        104
    G64q9J89mN5KSgmE  
       21 天前
    @terranboy
    RAG 核心是数据处理、向量化、召回、排序、重组,你哐哐哐把一堆文档丢进去,当然效果差
    这些要做好,都得手动开发,至少的是大数据+机器学习的技术栈了
    wyntalgeer
        105
    wyntalgeer  
       21 天前
    @terranboy 把你的文档扔给 AI 整理一下给 RAG ,再探再报
    clear
        106
    clear  
       21 天前
    和 ragflow 区别或者优势在哪里
    Bunsei
        107
    Bunsei  
       21 天前
    看起来还不错,有空试一试。
    xinta
        108
    xinta  
       14 天前
    @ren2881971 其实私有化,除了钱多,我觉得没啥优势,又不是军工涉密单位
    seth19960929
        109
    seth19960929  
       7 天前
    请教一下,像 cursor 那样项目级分析代码是用知识库分析?
    LanhuaMa
        110
    LanhuaMa  
       5 天前
    v2 新 casdoor
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3226 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 11:52 · PVG 19:52 · LAX 04:52 · JFK 07:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.