现在公司写爬虫的风险有多大?还能抓吗?

2018-12-26 11:49:22 +08:00
 bighead22

看了篇文章 https://www.yuanrenxue.com/crawler/web-crawler-law.html 里面讲了有公司抓今日头条数据,被今日头条告了, 以《刑法》第 285 条:非法获取计算机信息系统数据罪,被判有期徒刑,嚓 被判刑依据是“修改 UA,绕开访问频率控制”,写爬虫这不是常用手段吗????? 这下写爬虫前,岂不是先要去读一下刑法呀,呃呃

11188 次点击
所在节点    Python
49 条回复
bighead22
2018-12-26 12:01:57 +08:00
要低调????
idcspy
2018-12-26 13:23:15 +08:00
去判决文书网看看,多呢,特别是网安法施行以后。
Allen163
2018-12-26 13:31:34 +08:00
爬虫都不是太合法吧。这可怎么办呢
mapnaqi
2018-12-26 13:45:13 +08:00
应该是要看爬虫爬的数据是什么数据, 还有是否盈利
bayker
2018-12-26 13:50:51 +08:00
这里判刑的是绕过了身份验证的吧,正常爬公开的数据也违法?
wsh1108
2018-12-26 13:54:55 +08:00
背后一凉,我要辞职
wenzhoou
2018-12-26 14:03:25 +08:00
如果法律上出现非法这个词而且没有解释的话。很搞笑啊。
loveour
2018-12-26 14:15:26 +08:00
不知道有没有谁知道详情,印象里判决书那段确实很扯,但是实情是抓数据的人是头条出来的,应该是利用了头条内部的什么漏洞抓的数据,不是爬公开数据。另外,如果判决真的就是那样成立的,那其实百度也可以被套进去。。
o0
2018-12-26 14:32:19 +08:00
如果触犯刑法,那就肯定 GG。
zzNucker
2018-12-26 14:37:34 +08:00
显然违法的。。。 你多关心一下网络安全法和判例吧
bighead22
2018-12-26 14:54:37 +08:00
判决文书里写得很模糊,感觉像绕开对方的访问控制策略就会遭殃。。。。。。。
bighead22
2018-12-26 14:55:15 +08:00
@zzNucker 能再阐述多一点么
crab
2018-12-26 14:57:25 +08:00
利用漏洞和正常爬能一样吗?要这样百度和谷歌都不敢爬了。
tabris17
2018-12-26 15:01:18 +08:00
@bighead22 如果绕开访问控制策略就会判刑,那么必须公开自己的访问控制策略才行啊,否则我怎么知道是不是不小心歪打正着的
zjsxwc
2018-12-26 15:07:07 +08:00
百度等搜索引擎或成为最大的被判刑者

2333333333
flatflax
2018-12-26 15:24:15 +08:00
文章的案例里面,写爬虫的小公司因为 Linkedin 反爬虫而告 Linkedin,法院还判胜诉了。

结论是“如果数据拥有者有证据向法院起诉的话,抓取数据的一方多半会败诉。”

黑人问号????
bighead22
2018-12-26 15:41:29 +08:00
@flatflax 那个是讲的国外反例吧。。
bighead22
2018-12-26 15:42:06 +08:00
@tabris17 这很讲理,哈哈哈
hyshuang2006
2018-12-26 15:42:52 +08:00
天眼查爬各大.政.府.部.门服务器的数据,怎么就没人管呢?还公开贩.卖企业负责人姓名、电话...
passerbytiny
2018-12-26 16:08:15 +08:00
网络爬虫(英语:web crawler ),也叫网络蜘蛛( spider ),是一种用来自动浏览万维网的网络机器人。其目的一般为编纂网络索引。……网络爬虫可以将自己所访问的页面保存下来,以便搜索引擎事后生成索引供用户搜索。……不愿意被爬虫访问、被爬虫主人知晓的公开站点可以使用 robots.txt 文件之类的方法避免访问。 —— 摘自维基百科 https://zh.wikipedia.org/wiki/%E7%B6%B2%E8%B7%AF%E7%88%AC%E8%9F%B2

楼主你那不叫作爬虫,你那是恶意抓数据,从来就没合法过。

Linkedin 案例,那个小公司是用正常的爬虫去爬,然后自己分析(简单得说就是高级人肉搜索),Linkedin 就加了手段,只让搜索引擎爬,不让那小公司爬。Linkedin 相当于开门接客,大家都可以只看不上,但是那个只画像并且回头用画像赚钱的鳖孙,乱棍赶走;头条那个案例相当于闭门接客,不准只看不上,有人捅窗户纸偷偷看:这俩区别太大了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/521096

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX