V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
maggch97
V2EX  ›  奇思妙想

搭建一个视频洗稿检测平台是否可行

  •  
  •   maggch97 · 2022-08-31 20:30:10 +08:00 · 2086 次点击
    这是一个创建于 575 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://www.bilibili.com/video/BV1kS4y1s7nC

    今天在哔哩哔哩视频看到一个视频, 后半部分 IMF 的介绍我清晰的记得之前在其他视频中看过, 但是却找不到了.

    我在想针对这些知识性的视频, 能不能搭建一个洗稿检测平台. 文章的洗稿检测其实很简单, 搜索引擎索引了海量的文章页面. 对于视频, 搜索引擎就无能为力了.


    我的一个简单想法是采集哔哩哔哩,YouTube 这两个网站视频的字幕数据,如果没有字幕就需要语音识别. 通过字幕文本来做相似度的检索.

    这里面最大的成本应该是如果视频没有提供外挂的字幕, 下载视频的流量以及语音识别需要的算力是不小的开支.



    之前在知乎看到过有人使用维权骑士保护文章, 不过刚刚看了一下主页貌似只保护文章.

    https://www.rightknights.com/
    5 条回复    2022-09-01 12:11:09 +08:00
    maggch97
        1
    maggch97  
    OP
       2022-08-31 20:52:53 +08:00 via Android
    https://www.whaleip.com/

    搜到了一个维权骑士团队开发的支持视频版权保护的页面,里面写了实时监控全网数据。就是不知道这个数据范围究竟有多大了。
    indexError
        2
    indexError  
       2022-08-31 22:55:38 +08:00 via Android   ❤️ 1
    合作伙伴:人人视频…
    AJDX3906
        3
    AJDX3906  
       2022-09-01 08:38:34 +08:00 via Android
    "实时监控全网数据" 怎么实现的呀,能处理那么多视频数据么
    newmlp
        4
    newmlp  
       2022-09-01 09:58:01 +08:00
    @AJDX3906 可能只监控了流量热度比较高的内容
    AJDX3906
        5
    AJDX3906  
       2022-09-01 12:11:09 +08:00 via Android
    @newmlp 这种方案感觉可行,热门视频收益高,造成的"盗版影响"也广泛;冷门视频维权成本太高
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5533 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 06:39 · PVG 14:39 · LAX 23:39 · JFK 02:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.