V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pureGirl
V2EX  ›  程序员

现在开源的向量数据库能做到支持千万级的数据吗

  •  
  •   pureGirl · 1 天前 · 1359 次点击
    9 条回复    2025-09-07 11:13:59 +08:00
    summerwar
        1
    summerwar  
       1 天前
    能,千万级要是不支持,那还怎么开源
    5261
        2
    5261  
       1 天前
    啥业务场景会需要用到向量数据库呢?
    fFeeOps
        3
    fFeeOps  
       1 天前
    用 ES 也能平替一把吧,ES 到千万还是轻松的
    soulflysimple123
        4
    soulflysimple123  
       1 天前
    Milvus 、Qdrant 、Weaviate 这些主流的开源向量数据库都可以
    hackpro
        5
    hackpro  
       1 天前 via iPhone
    小意思
    w568w
        6
    w568w  
       1 天前
    可以啊,之前尝试过 pg_vector 单机千万数据,单次查询 100ms
    crackidz
        7
    crackidz  
       23 小时 45 分钟前
    可以的
    bbbblue
        8
    bbbblue  
       21 小时 25 分钟前
    直接用服务 zilliz serverless 千万很容易 存储成本也低
    就是用 serverless 查询量上来了很烧钱。。
    Codishek2005
        9
    Codishek2005  
       10 小时 46 分钟前 via Android
    > @5261
    > 啥业务场景会需要用到向量数据库呢?

    较常见的用途是语义搜索。比如开源图片库 Immich 可以用机器学习实现语义搜索(原理是预先用图片跑嵌入模型,生成向量存到数据库里。搜索的时候用文本也跑一遍得到向量,再从数据库里查询最接近的记录,向量方向越接近语义越接近)

    除了语义搜索之外的其他用途我不清楚
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2864 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 18ms · UTC 13:59 · PVG 21:59 · LAX 06:59 · JFK 09:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.