现在公司写爬虫的风险有多大?还能抓吗?

2018-12-26 11:49:22 +08:00
 bighead22

看了篇文章 https://www.yuanrenxue.com/crawler/web-crawler-law.html 里面讲了有公司抓今日头条数据,被今日头条告了, 以《刑法》第 285 条:非法获取计算机信息系统数据罪,被判有期徒刑,嚓 被判刑依据是“修改 UA,绕开访问频率控制”,写爬虫这不是常用手段吗????? 这下写爬虫前,岂不是先要去读一下刑法呀,呃呃

11157 次点击
所在节点    Python
49 条回复
xpresslink
2018-12-26 16:44:03 +08:00
这种文章的目的不是为了真理和正确,也不是为了教育读者,能吸引更多眼球就是胜利。所以看看就好。
黑客和爬虫行为上虽然有时很接近,但是本质是非常不同的,不能听见喇喇蛄叫就不种庄稼啦。
yzkcy
2018-12-26 16:53:23 +08:00
得看你爬什么数据,反正我见过的搞爬虫的,爬敏感数据的不是没有(更有甚者利用某些漏洞,比如越权、未授权的接口等)。

其实这行业这么乱,也该整顿整顿了。
chroming
2018-12-26 17:09:30 +08:00
搞爬虫的很多,主要看你爬什么以及对方是不是在意了
zzpx
2018-12-26 17:10:46 +08:00
百度地图爬大众点评数据,被判赔了几百万
tabris17
2018-12-26 17:13:45 +08:00
@zzpx 李彦宏不用坐牢吗
commadou
2018-12-26 17:33:33 +08:00
我觉得应该是一个是看原网站的数据保留等级吧,另一个是看数据爬了怎么用,如果是免登陆就默认随便爬,如果你爬的时候又是模拟用户登陆又是绕过验证码又是避免浏览频率限制就有些问题了,如果是爬竞争公司的数据放到自己的平台上并作为盈利,这被告妥妥的。
mytsing520
2018-12-26 17:38:30 +08:00
突破 APPKEY 或 SecretKEY 的验证,及它的访问频率限制(如果有)等做法均可以被视为非法
bighead22
2018-12-26 18:03:43 +08:00
@tabris17 大公司能赔钱免灾吧
Pythondr
2018-12-26 18:12:31 +08:00
neptuno
2018-12-26 18:48:50 +08:00
小公司不会被告,大公司不怕被告
bighead22
2018-12-26 19:30:18 +08:00
@neptuno 是这个理
mmdsun
2018-12-26 19:38:14 +08:00
还有非法入侵他人计算机罪。所有爬虫公司要开高点。。
mumbler
2018-12-26 19:45:47 +08:00
爬本身不存在违法与否,关键看用途,你爬了今日头条数据做语料分析,谁会来告你啊,但你做个今日头条竞品,人家就算买通法官也要搞死你,有没有法律都不重要,参考珊瑚虫 QQ 案
wispx
2018-12-26 19:49:54 +08:00
完了,我抓了 bing 的每日的图,bing 会不会告我啊。。。(doge),https://wallpaper.wispx.cn
neo3991
2018-12-26 19:59:43 +08:00
今天同事还跟我讨论呢,如果你自己搭网站,爬虫新闻放到自己网站上,里面再放上谷歌、FB 的广告,然后自己就能运营起来赚钱了。。。。
bighead22
2018-12-26 22:39:11 +08:00
@neo3991 这绝壁要遭
richangfan
2018-12-26 22:45:41 +08:00
合情合法就不会有反爬虫了
binghe
2018-12-26 22:51:44 +08:00
假如目标网站是非盈利,公益性,便民性的,然后我爬过来的数据也是用于便民,非盈利的话,应该没事吧。
akira
2018-12-27 02:18:29 +08:00
@neo3991 爬一堆新闻放自己的网站,做好了就是头条了呗
luckbbs
2018-12-27 07:18:41 +08:00
获取未授权的数据就是违法,今日头条的新闻是它的核心 IP 了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/521096

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX