有没有内存数据库可以存矢量(比如 numpy 中的 ndarry)可以支持简单矢量运算

2021-08-04 14:24:21 +08:00
 zealinux

想把特征值矢量全都存 DB,一般只是存一个进去,然后与之前的所有的矢量进行比较。 拿到比较结果就行。

不想着全部取出来,拿到应用本地再计算。就想着在数据库层面做掉。

如果这个内存数据库能支持 ndarry 就更好了。

1330 次点击
所在节点    数据库
6 条回复
kilasuelika
2021-08-04 14:32:06 +08:00
不知道能不能把每个矢量作为 1 行存进数据库。
这样每一列都是数值类型,直接比较。
qieqie
2021-08-04 16:01:28 +08:00
Elasticsearch 的 dense_vector,ClickHouse 的 Array
RangerWolf
2021-08-04 23:00:37 +08:00
https://milvus.io/
据说很厉害
codyfeng
2021-08-05 08:29:10 +08:00
kdb 可能符合 lz 要求
rainfd
2021-08-05 11:41:22 +08:00
milvus + 1
dayeye2006199
2021-08-06 05:16:07 +08:00
你要的计算功能可能是 ANN ( approximate nearest neighbor )。
这个计算有比较多的实现
例如[Faiss]( https://github.com/facebookresearch/faiss)
[ANNOY]( https://github.com/spotify/annoy)

但这些一般只管算,不管存。

需要比较完整的数据库功能的,那就是楼上推荐的 Milvus,或者給 postgres 打插件,例如[pgvector]( https://github.com/ankane/pgvector)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/793603

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX