V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
mythjava
V2EX  ›  Local LLM

10 万条记录, 我应该选择什么 Embedding 模型和向量数据库呢

  •  
  •   mythjava · Oct 14, 2025 · 1779 views
    This topic created in 200 days ago, the information mentioned may be changed or developed.

    想要在本地服务器上跑开源模型, 这样能省一点钱, 不过如果云上 API 的效果比较好的话, 在云上也是可以的

    我对这方面不是很了解, 希望各位给出指导意见

    3 replies    2025-10-14 13:51:00 +08:00
    spike0100
        1
    spike0100  
       Oct 14, 2025   ❤️ 1
    仅供参考:
    8w 多条数据
    向量数据库:ES (已有数据库的扩展,不想维护新的数据库)
    模型:text-embedding-v4 (支持多语言)
    mythjava
        2
    mythjava  
    OP
       Oct 14, 2025
    @spike0100 十分感谢
    liulicaixiao
        3
    liulicaixiao  
       Oct 14, 2025   ❤️ 1
    不搞长期大工程,单纯练手可以用 faiss ,python 调个库就能用,内置也有小型的 embedding model ,或者用 openai text-embedding-3-small 级别能满足大部分要求。如果是企业级甚至更高,我就不清楚了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2345 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 10:52 · PVG 18:52 · LAX 03:52 · JFK 06:52
    ♥ Do have faith in what you're doing.