爬取某个视频网站的评论内容(研究需要),是合规的吗

2021-01-23 13:48:44 +08:00
 antalwang
emm,爬虫相关的制度不太懂,想爬取某视频网站的评论内容(用于项目研究),现在遇到了如下问题,
1:爬评论较多的视频有时会报错,没有内容返回,浏览器打开视频网站发现评论区的内容无法加载,这种情况是被反爬虫 ip 封禁了吗?
2:爬取评论的这个行为是合规的吗?需不需要向视频网站申请?获得许可或者支付费用?
747 次点击
所在节点    问与答
1 条回复
FaceBug
2021-01-23 15:55:22 +08:00
1 、建议你优化代码,当判断到请求返回的数据清洗后为空的时候,记录本次请求的代理 IP 、源数据、http code 等数据,以此来筛查可能的原因

2 、如果网站有规则不允许你爬,或者允许你爬但是你严重影响到网站的正常使用、消耗了较大流量都是不合规的;如果网站本身提供 API,允许开发者获取评论数据,你就去申请,但是以我的了解,应该不会有人会给你用户数据的,被发现了视频网站吃不了兜着走

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/747659

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX