搭建一个视频洗稿检测平台是否可行

2022-08-31 20:30:10 +08:00
 maggch97
https://www.bilibili.com/video/BV1kS4y1s7nC

今天在哔哩哔哩视频看到一个视频, 后半部分 IMF 的介绍我清晰的记得之前在其他视频中看过, 但是却找不到了.

我在想针对这些知识性的视频, 能不能搭建一个洗稿检测平台. 文章的洗稿检测其实很简单, 搜索引擎索引了海量的文章页面. 对于视频, 搜索引擎就无能为力了.


我的一个简单想法是采集哔哩哔哩,YouTube 这两个网站视频的字幕数据,如果没有字幕就需要语音识别. 通过字幕文本来做相似度的检索.

这里面最大的成本应该是如果视频没有提供外挂的字幕, 下载视频的流量以及语音识别需要的算力是不小的开支.



之前在知乎看到过有人使用维权骑士保护文章, 不过刚刚看了一下主页貌似只保护文章.

https://www.rightknights.com/
2268 次点击
所在节点    奇思妙想
5 条回复
maggch97
2022-08-31 20:52:53 +08:00
https://www.whaleip.com/

搜到了一个维权骑士团队开发的支持视频版权保护的页面,里面写了实时监控全网数据。就是不知道这个数据范围究竟有多大了。
indexError
2022-08-31 22:55:38 +08:00
合作伙伴:人人视频…
AJDX3906
2022-09-01 08:38:34 +08:00
"实时监控全网数据" 怎么实现的呀,能处理那么多视频数据么
newmlp
2022-09-01 09:58:01 +08:00
@AJDX3906 可能只监控了流量热度比较高的内容
AJDX3906
2022-09-01 12:11:09 +08:00
@newmlp 这种方案感觉可行,热门视频收益高,造成的"盗版影响"也广泛;冷门视频维权成本太高

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/876817

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX