向量数据库:一种专门用来存储和检索“向量(embedding,嵌入向量)”的数据系统,常用于相似度搜索(如按语义找相近文本、图片、音频)与推荐、RAG(检索增强生成)等场景。它通常支持按距离度量(如余弦相似度、欧氏距离)进行近似最近邻检索(ANN)。
(也可泛指“支持向量检索能力的数据库/系统”,实现形式可能是独立产品或传统数据库的向量扩展。)
/ˈvɛktər ˈdeɪtəˌbeɪs/
We use a vector database to find documents similar to a user’s question.
我们使用向量数据库来查找与用户问题相似的文档。
After generating embeddings for millions of product descriptions, the team indexed them in a vector database so the app could power real-time semantic search and recommendations.
在为数百万条商品描述生成嵌入向量后,团队把它们建立索引存入向量数据库,使应用能够实现实时语义搜索与推荐。
vector 源自拉丁语 vector(“搬运者、运载者”),在数学/计算中引申为“具有方向与大小的量”,在机器学习里进一步常用来指“特征向量/嵌入表示”。
database 由 data(数据)+ base(基础/库)构成,指“数据的存储与管理系统”。组合成 vector database,即“以向量为核心存取单位的数据库”。