根据电影某一帧,匹配到某个电影。

2019-11-16 13:56:52 +08:00
 xiatong

今天看到一个电影画面,想找到是哪部电影,好困难。想想否做一个小公举。 需求:根据某一帧(有可能某一帧的一部分)来在电影库中匹配电影。 解决思路:将图片按照帧拆分,保存特征信息。 难点: 1.需要庞大的电影特征库支持。 2.在大量数据中查询 3.解析大量电影,提取特征

大佬们有什么想法吗?

15718 次点击
所在节点    Java
91 条回复
HTSdTt3WygdgQQGe
2019-11-16 19:14:19 +08:00
给我几百万就可以搞定,做一个悬赏平台即可,谁认识这电影,给他 1 万
dai640
2019-11-16 19:24:50 +08:00
这个可是功德无量,千秋万载的宏伟项目啊。
areless
2019-11-16 19:45:09 +08:00
那得片源图片不经过压缩,一个有损的图,或者有损压缩的影片,跟无损母带的数据构成~~天差地远,这就是图形的巧妙之处
areless
2019-11-16 19:54:51 +08:00
请 100 个员工装成是 ai gpu 计算~~~很多 ai 是这样的。ai 有个准确率到达一定数值以后,继续学习~~~反而变低的情况。据我所知,请 10 个员工根据身份证照片通过摄像头辨别是否是本人,是来得及的~~~每次收费几毛,工资也是发的起的
yangxin0
2019-11-16 19:56:25 +08:00
这个做起来非常简单。爬一下豆瓣的数据提取人脸特征集合,然后对 video 抽帧分析很容易做。
A3m0n
2019-11-16 20:47:18 +08:00
有一个根据台词找电影的: http://www.quodb.com/
realpg
2019-11-16 21:38:49 +08:00
楼主应该是没有预算的

所以 最低廉成本的方式就是做个网站 /APP
然后招聘一堆兼职员工 认出一个给 5 毛钱 前台有人发后台就发单众包给大家认
A18524478970
2019-11-16 21:46:21 +08:00
sauce nao 可以查动漫截图,还可以查找 p 站 id
要是电影的话这数据库就太大了,不盈利难以支撑下去
Foxkeh
2019-11-16 22:50:22 +08:00
B 站有个主播人肉帮你找.
甚至有个动漫里放动漫,别人请他找,他还给找到了那一集是柯南的一个镜头.
exploreexe
2019-11-16 23:48:34 +08:00
谷歌有在做这项技术,我记得之前看过一个宣传片说这事,大意是谷歌觉的以后视频搜索很重要,除了标签和标题之外,谷歌想通过分析视频给这个视频更好的标签等信息,从而优化搜索结果。
Bwoywan
2019-11-17 00:10:12 +08:00
关于图片资源这东西,我想到了谷歌相册免费提供的图片空间和图片智能识别,这还真是“免费”的资源啊
uptime
2019-11-17 01:40:06 +08:00
微信群也经常有人发一些视频片段,问是是不是电影是哪的电影。
基本上,我看过了都能找到
这些片段,好多也是很冷门的电影、美剧。
不过你说只给一张截图,除非很热门的电影,否则就太难了。一部电影好多都是 2 个小时时长的…… 除了黑白、彩色,明星脸、某些道具等具有特征可作筛选外,否则都很夸张的大数据
feast
2019-11-17 01:40:29 +08:00
@blackwolf 这东西就两个要素 1.数据量 2.识别算法 前一个天量数据,基本储存检索都困难,后一个算法 倒是有不少成熟例子,主要是视频数据量太大这是根本问题
cedoo22
2019-11-17 01:55:44 +08:00
我有个想法,给播放器加弹幕功能,匹配电影特征,自动播放弹幕。
gosas
2019-11-17 02:05:33 +08:00
不如发出你的截图
binux
2019-11-17 02:10:18 +08:00
如果只是拿其中一帧搜索的话,匹配下 fingerprint 就行了。
lihongming
2019-11-17 02:33:32 +08:00
感觉还是得先从人脸识别开始,这就可以大大缩小范围了,如果有多个人脸,范围就可以进一步缩小至个位数了,再辅以周边物体就基本可以确定番号了。

什么?你只有菊部特写?那当我没说吧。不过话说回来,随便返给你一部电影,你也分辨不出对不对不是么?
zyzll1234
2019-11-17 02:38:55 +08:00
用 chrome 的 noobox 插件,可以搜图,直接搜就可以
dusu
2019-11-17 04:40:01 +08:00
电影检索核心其实还是降维的问题。

电影先降维到每一秒为截图,剔除掉相似度大的截图,存大盘鸡或 oss,然后转 simhash 之类的存检索库,求相似度应该能粗略解决一些需求。

假如一本电影 2 小时,截图 7200 张,滤重后假设 5000 张?算检索 100w 部电影最终也就降维到 50 亿张图片的 simhash 检索而已。

当然,图片特征识别应该是在检索降维中比较重要的一些细节等等,个人小团队要想做好这个引擎,应该有很长的路要走。
hehheh
2019-11-17 05:16:30 +08:00
谷歌已经能干这个了你们不知道吗?有时候用图片搜索,如果视频某一帧有匹配结果的话,会有视频结果出来。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/620175

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX