背景:
- 根据一段文案(假设为商品标题)的向量值在 es 中查询出相似的文案(商品) knn_search
- 向量维度是 1024 维度 余弦函数计算距离
- 目前已有数据是 600w 左右 整体 es 数据量在 250g 左右
- es 节点 8c32g *3
问题
目前想前台使用这种向量查询的结果 但是问题是目前单次查询的效率很低基本上得 60s 左右才能返回。
- 有大佬有经验这种量级的查询大概需要升配到什么配置吗?
- 或者有什么其他的查询优化方案吗?
其他
- 为啥非得用 es 不用其他向量库 例如 milvus ?:因为存量数据在这儿,所以暂时没有迁移。
- 另外我看到的有限的返回结果中,很多文案相近但是不是同一个商品的也会被查询出来,准确率其实有待考证。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/1050773
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.