imn1
2022-07-27 20:42:15 +08:00
原理就不说了,自己搜搜
处理过程很简单,python 也就几行代码
java 不知道
opencv::img_hash 下面右若干个子类
opencv::img_hash::PHash
opencv::img_hash::AverageHash
opencv::img_hash::RadialVarianceHash
opencv::img_hash::MarrHildrethHash
opencv::img_hash::ColorMomentHash
opencv::img_hash::BlockMeanHash
opencv::img_hash::BlockMeanHash
每个都有 compute/compare 两个方法
compute 是计算一张图片的的 img_hash 值(一般都是先转换成灰度图再计算)
compare 是比较两个 img_hash 值的结果,低于临界值就认为“相似”,临界值网上能搜到参考,也可以自定义
img_hash 值可以保存,这样可以用于多次 compare ,不需要图片本身
所以说,代码没什么意义,随便能搜到,img_hash 值保存的数据库才值钱
单核一对图比较很快,毫秒级,但库比较巨大的话是需要并发 compare ,最好有预分类,估计能省千万级的计算
其实单个 img_hash 比较,准确度不是很高,我是组合着用的
另外是水印、旋转、裁切这些会导致比较基本无效
另外还有其他 img_hash 以外的方法,复杂一些,慢一些,但准确一些,不过更麻烦的是一般需要图片本身,不像 img_hash 那样可以“离线”比较