而且可以先对 B 集里面每个图片归类,比如 B 集下面 可以有 猫、狗、人,鱼这 4 个归类的代表特征矩阵, 要搜索 A 时先 让 A 与 4 个归类的代表特征矩阵比较,然后再在最像的 归类下的 图片 比较; 类似的,对归类 再归类,这样多分几个层次,运算量就小下来了。
Tromso
2020-07-01 16:57:43 +08:00
关键词 simhash, faiss
zjsxwc
2020-07-01 17:01:45 +08:00
这归类的归类的 N 层分类, 可以 工程上, 定期,抽取 M 个随机图片 作为 第一级 归类的 M 个 代表特征矩阵, 然后 在 在 每个 归类特征 下 统一的方式 构建 第二级 归类, 其实就是索引了
Morriaty
2020-07-01 17:10:47 +08:00
抽象出的问题是 ANN (approximate nearest neighbor), 一般方法有
- LSH and multiprobe LSH for euclidean distance - partition trees for euclidean/cosine distance - clustering-based approaches, including product quantization
python 的话就直接调用 annoy
ruanimal
2020-07-02 10:25:02 +08:00
有,图库的图片先算好 simhash 或者 briefhash
第 1 页 / 共 1 页
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。