抖音和快手会对视频进行相似度检测吗?

2021-11-08 15:14:46 +08:00
 xlsepiphone

如果一个人同时上传两个相同的视频,我相信他们都会做 md5 检测,但是如果给视频加上封面图或者做其他修改操作,视频的 md5 就会改变。

那么除了最后的人工兜底外,抖音和快手是否会对一个用户的多个视频,或者多个不同用户的视频进行相似度检测呢?

如果采用抽帧的方式最后计算汉明距离,会涉及到解码,无论使用 FFmpeg 还是自己纯手工撸代码实现,后端的资源占用是不是巨大?

或者是否有更加便捷的方式实现视频的相似度检测?

不然他们是怎么实现屏蔽掉或者限流那么多相似的重复投稿的垃圾视频?通过人工和用户举报吗?

3038 次点击
所在节点    问与答
27 条回复
ch2
2021-11-08 17:01:55 +08:00
用机器学习检测的,字节跳动就是算法起家
这种都是小意思,用不了多少算力资源的
sunshijie
2021-11-08 17:05:38 +08:00
dy 有接口返回抽视频帧的图片
jdhao
2021-11-08 17:17:25 +08:00
检测重复需要机器学习算法,一般是看两个视频有多少相似度高的帧,可能还要结合音频判断是否重复,另外大公司不缺钱,别纠结资源问题,视频这种东西资源消耗肯定是很大的,谷歌在 youtube 去重算法投入上都是上亿美元的。之前正好写过一篇 https://jdhao.github.io/2021/08/02/the_youtube_content_id_system/
cairnechen
2021-11-08 17:20:23 +08:00
微博不是有这个机制吗?
realrojeralone
2021-11-08 17:40:41 +08:00
会的,两个公司都有专门的内容理解团队来做这件事,视频上传后做异步判重,相似视频做降权打压,一般都是模型判别
NCZkevin
2021-11-08 18:05:32 +08:00
两家公司都有专门的算法团队做这块的,至于视频的处理,都有自己一套完整的流水线来处理,每一步该干啥都有相应的团队负责和优化
zerofancy
2021-11-08 23:30:52 +08:00
前面应该是机器审核,有问题或达到一定传播量后二次审核,工作量没有那么庞大

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/813884

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX