我做了一个自动搬运B站视频到 youtube 的 bot,结果被谷歌封了

2019-01-13 13:08:41 +08:00
 zhangolve

真实经历,写了篇博客总结下。

一个 YouTube 视频搬运工的教训

节选:

说一下,我搬运视频的代码思路。这种做法,毕竟是侵权的。

首先,通过 node 爬虫,模拟浏览器的访问,获取到B站某个 up 主的所有视频,接下来通过 node 的 child_process 来执行 you-get 的命令行命令,使得这个 up 主的视频能够批量地被下载下来。当然,我并不想竭泽而渔,也觉得老视频没有多少意义,所以每个 up 主,我最多只爬去最新的 100 个视频。

接下来,我会将视频通过 YouTube 接口的方式,批量地上传到指定的频道上面去。

后来,随着我的开发,细节也越来越完善。

支持持续订阅某个 up 主,思路也无非是隔一段时间,爬去最近这段时间内他的上传的视频。

支持将同一个 up 主的视频放到同一个播放列表里,之所以这样做,一则是因为视频更方便管理和浏览。二则是害怕某天突然被告知,我偷了他的视频,这样删除的时候,也只需要找这个播放列表里的视频删除可以了。

原有的视频下载和上传的脚本是隔离的,导致做不到自动化。后来,这个工作实现了自动化。只需要在一开始将某个 up 主进行订阅,之后,下载,上传,长期订阅和上传这个 up 主的视频都能够自动完成。

坦白讲,写这个代码写得还挺开心,很大一部分因为是以前很少用到 js 里异步控制的 async await,但是这次代码写起来,用了很多,也用得很爽吧。另外以前也很少写 node 的后台服务,最多也就是写两个爬虫,这次却借助这个想法,顺便学了一波 node 服务的部署和运维(为了做这件事情,也为了科学上网,我当时还买了一台阿里云 vps,后来因为科学上网,服务挂了。我又换到了搬瓦工,这才一切稳定)。当然,有人可能会觉得我这种行为侵权,这个话题,我一会儿再聊。

7079 次点击
所在节点    奇思妙想
65 条回复
zhangolve
2019-01-14 09:24:54 +08:00
@ilgharkus 一会再说的意思是,写文章是要一段一段写的,那一段只是用来写技术实现思路。
所以,有没有看原文?
zhangolve
2019-01-14 09:26:50 +08:00
@zingl 又一个没看原文的。
kzfile
2019-01-14 09:27:33 +08:00
如果你爬了视频,加个片头,来个倒放,随机加几个滑稽,谷歌会不会认为是原创?
zhangolve
2019-01-14 09:31:34 +08:00
@wqyyy 你说的真的很有道理。但是你说到羞耻,我就得辩解两句了。

我知道侵权不对,这是知羞耻吧。我在这里分享,也是因为我知羞耻。

我开了这个帖子之后,有两个人想跟我要代码,都没有给,也是知道羞耻才这样的。

至于说到 Aaron Swartz,看我第二条附言。
AfChu
2019-01-14 09:33:33 +08:00
@kzfile 不会,你太小看谷歌的分析能力了。这样做连个伪原创(半原创)都算不上。
xz
2019-01-14 09:38:27 +08:00
楼主我支持你,开源交流学习一下吗?
msg7086
2019-01-14 10:27:55 +08:00
你只要记住,侵权(搬运) + 挣钱 = 犯罪。

是触犯刑法的犯罪,不是普通的「违法行为」。如果你靠搬运挣了钱,在知道你身份的情况下,公安局完全可以派人上门抓现行,然后走公诉渠道给你判刑,有期徒刑三年以下并处罚金。

请小心行事,好自为之。
lostberryzz
2019-01-14 11:05:11 +08:00
不讨论楼主做法的好坏,你帐号被封极有可能是剪辑视频原作的版权问题
aocif23
2019-01-14 11:16:00 +08:00
被封前你的油管帐号或 gmail 有没有多次收到版权警告?有的话被封是正常。
zhangolve
2019-01-14 11:46:58 +08:00
@xz 别别别,这没什么光彩的。我也不会开源的。
zhangolve
2019-01-14 11:47:27 +08:00
@lostberryzz 是这样,我原文有解释。
ooh
2019-01-14 12:13:05 +08:00
1.B 站限速,2.没法下载高清的,3.获利还需要累积 1000 订阅者,4.我怀疑有公司是不是在专门做这一块...
kingcc
2019-01-14 12:47:52 +08:00
> “只是说版权这件事,可严格可宽松,真要较真的话,我搬运的那些 up 主他们同样有侵权行为。”


侵权就是侵权,不要为你的行为找借口
herozzm
2019-01-14 12:56:43 +08:00
lz 这个项目应该是来自己很多付费的知识课堂,这是个伪项目,之说了前半段的点子,没有说到后面的无路可走的情况,
在类似课堂公开的的点子,肯定是走不通的
passerbytiny
2019-01-14 13:03:38 +08:00
一个词形容:恬不知耻。bolck 加持
tailf
2019-01-14 13:10:17 +08:00
第一次遇到到这个不能删帖的平台上发帖,说自己不要脸的。



大千世界,无奇不有。
eurokingbai2
2019-01-14 13:16:08 +08:00
楼主你没尝过被人侵权的痛苦,你就是犯法了!
locoz
2019-01-15 11:17:46 +08:00
看完了原文,划几个重点出来:
“我觉得这是个不错的点子,后来又经过研究,得知 YouTube 上的视频,大概每千次观看量,视频的所有者可以得到大概 5 元人民币的收益(已经过换算)。而内容的影响力又是绵延不绝的,只要是好的内容,接下来就是躺着挣钱了。”
“毕竟我要做的,也不是自己制作视频,而是靠搬运。”
“但是,从搬运的前几天起,邮箱里就开始接收来自官方的版权警告。”
“不过我并没有对这种版权警告有所警惕,只是觉得,既然 YouTube 很智能,能够帮我查找到哪些视频是侵权的,哪些不是,那我只需要把一些漏网之鱼搬运上去,也就很好了。”
“当第三次收到这种邮件之后,我那个视频频道就被封锁了,而且很快,我谷歌帐号关联的另外一个我平时看视频的频道,也被封锁了。我发了两封邮件过去,想要解释我的动机。我解释了我是个程序员,只是为了学习知识”
“当然我也不否认,我的侵权行为,毕竟你从贼的手里偷到了路人的钱包,难道你就是清白的吗?”
“我还记得我那个频道刚刚建立十几天的时候,因为搬运了某个在B站上有1万+粉丝数量的 up 主的小视频,因为我的播放列表名字就是这个 up 主的名字,因而在 YouTube 上搜索很容易找到。那个 up 主在我搬运他的最新的一个视频下面留言,说他就是B站上的谁谁谁。也只是说了这么一句,我也并没有回复他,我又能说什么呢?”
“关于盗版这件事情,我自己的态度一直模凌两可。我不认为这件事完全没有正面价值,不然,我也不会去做这样的事情。在写此文的时候,我甚至会想到 13 年去世的亚伦·斯沃茨 ,他是个反对禁止网络盗版法案的运动的人,很大程度上,我是欣赏这种黑客精神的。所以,我对版权上的问题,其实是没有多少反思的。因为如果真要较真的话,我搬运的那些B站视频 up 主们也毫无例外都有问题。”

总结一下就是楼主的想法是通过搬运 B 站别人生产的视频到 YouTube (未提及向 UP 主询问是否可转发),依靠广告收入来赚钱,然后被 YouTube 提示了侵权(侵的是素材原作者的权)多次之后还想着找到漏网之鱼搬过去,于是就被 YouTube 封号了。在被封号之后,依然试图找 Google 恢复账号,理由是“学习知识”??至于 B 站有 1W+粉丝数的 UP 主在楼主搬运的视频下留言的事情,因为已经搜不到楼主的账号了,所以也无从考证具体那个 UP 主说了什么,但看楼主文中所说的样子,估计也是说的没有询问 UP 主就搬运的事情。在文中的倒数第二段,楼主依然觉得这件事情有正面价值??这个正面价值就是问都没问过作者,直接就搬了别人的视频到另一个网站,试图通过这种方式赚钱?
政治不正确点:
1、试图通过搬运视频赚钱
2、搬运前未与视频作者沟通
3、已知搬运视频不正确依然继续搬运
4、已知 YouTube 对侵权审查严格,并在被提示多次后继续搬运
5、被封号之后试图忽悠 Google 方恢复账号
6、始终认为这件事情有正面价值
7、“别人偷东西有错,所以我偷他东西是理所应当的”
zhangolve
2019-01-15 15:57:16 +08:00
@locoz 关于你说的第七点,我专门黑体说了:在 YouTube 一样行不通。当然我也不否认,我的侵权行为,毕竟你从贼的手里偷到了路人的钱包,难道你就是清白的吗?

第六点,正面价值是对我自己有价值。
1-5不否认,我承认。
zhangolve
2019-01-15 15:59:12 +08:00
@zhangolve 其他的正面价值,当然还包括,可以让那些在海外的看不了B站的用户很方便地观看。就像是很多从 youtube 上面搬运视频来国内视频网站的人那样,他们是侵权的,但是他们做的工作,也不是毫无正面价值的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526553

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX