根据电影某一帧,匹配到某个电影。

2019-11-16 13:56:52 +08:00
 xiatong

今天看到一个电影画面,想找到是哪部电影,好困难。想想否做一个小公举。 需求:根据某一帧(有可能某一帧的一部分)来在电影库中匹配电影。 解决思路:将图片按照帧拆分,保存特征信息。 难点: 1.需要庞大的电影特征库支持。 2.在大量数据中查询 3.解析大量电影,提取特征

大佬们有什么想法吗?

15672 次点击
所在节点    Java
91 条回复
blackwolf
2019-11-16 14:57:17 +08:00
@imn1 phash/ahash 之类的鲁棒性不是很强,画面上加个“xx 字幕组”估计就不认识的,机器学习可能相对鲁棒性更高,更靠谱一些~~
ipadpro4k
2019-11-16 14:57:41 +08:00
最简单,1024 技术区每月求种贴,大神多
blackwolf
2019-11-16 15:00:40 +08:00
@feast 如果能借个美国第一超算 summit,上面全是英伟达的 v100 (具体忘了)卡,还是可以玩玩的,18 年,美国有个组把几十年的高清卫星云图训了一遍,做极端天气识别。我印象中他们解决的最大技术问题就是 io 直接把存储服务器搞爆炸的问题。
imn1
2019-11-16 15:07:27 +08:00
@blackwolf #37
Y,只是图像 hash,不算学习
我目前有个库,存有 10M 条 hash 值,不过不是电影,只是图片,目标是 150M+条,还在想如何避免全库搜索匹配
imn1
2019-11-16 15:19:33 +08:00
@blackwolf #43
如果只用一种 hash,准确率确实不高,不过三种 hash 同时匹配并取交集,准确性就高很多了

cv2.img_hash_PHash.create,
cv2.img_hash_AverageHash.create,
cv2.img_hash_RadialVarianceHash.create,
cv2.img_hash_ColorMomentHash.create,
cv2.img_hash_MarrHildrethHash.create,
cv2.img_hash_BlockMeanHash.create,
cv2.img_hash_BlockMeanHash.create,

我目前用前面四个做一些组合,暂时还可以,错误率在 1%以下
xiatong
2019-11-16 15:20:12 +08:00
@eason1874 主要演员。识别出来了,他的作品就么几部
lizz666
2019-11-16 15:23:40 +08:00
顺便开个公司叫 南京热 吗?
ClutchBear
2019-11-16 15:28:25 +08:00
增加根据剧情文字描述的匹配?
wangyzj
2019-11-16 15:46:05 +08:00
Goole Image 搜图不行么
vazo
2019-11-16 15:47:06 +08:00
没市场的伪需求
hycos
2019-11-16 15:52:54 +08:00
这个技术很成熟啊,就是拷贝检测,我们实验室在深度学习火之前就做这个。
xiatong
2019-11-16 16:26:01 +08:00
@wangyzj 搜到的大多数是比较经典的画面。要实现随机一张电影截屏都可以搜到。
xiatong
2019-11-16 16:26:32 +08:00
@hycos 我去看一下 [拷贝检测] 谢谢大佬。
sadfQED2
2019-11-16 16:31:04 +08:00
建库不难啊,没一帧存下来就行,匹配也不难,现在就有。难的是你怎么建索引啊,一个电影几个 G 的文件,就是你压缩,一部电影 200M 你得要吗,匹配的时候你总不能把所有电影遍历一次吧,所有如果建索引,那咋设计?
sadfQED2
2019-11-16 16:32:37 +08:00
@sadfQED2 #54
建库不难啊,每一帧存下来就行,匹配也不难,现在就有。难的是你怎么建索引啊,一个电影几个 G 的文件,就算你压缩,一部电影 200M 你得要吧,匹配的时候你总不能把所有电影遍历一次吧,但是如果建索引,那咋设计?

ps:上一条全是错别字,改一下
JCZ2MkKb5S8ZX9pq
2019-11-16 17:15:13 +08:00
好奇碰到大量重复画面怎么处理,比如以前动画爱用的变身重复镜头。
没有上下文的话,其它的近似排重还是挺难的。
beapig
2019-11-16 17:29:16 +08:00
做个人肉找片平台比较靠谱(类似某种人肉打码)
如果是社交平台上传来传去的图,谷歌的以图找图功能基本都能找得到。
刚刚试过:youtube 的视频是支持谷歌的以图找图的
qwertyzzz
2019-11-16 17:46:14 +08:00
做个论坛好了啊 发图片问老司机就 ok 了 不用技术
mahaonan93
2019-11-16 18:11:38 +08:00
豆瓣有个小组“看截图猜电影”,基本发张截图几分钟就会有人回复的(我也不懂这些人为什么这么闲)
ershierdu
2019-11-16 18:39:18 +08:00
或许可以以“镜头”为单位进行信息提取(长镜头的话适当做一下分割),加上机器学习,感觉还是有希望的

当然这只是技术层面,其他的比如楼上说的哪来这么多资源也是一个问题…说到底还是成本:费这么大劲弄出来的东西好像没多大实际意义…

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/620175

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX