写爬虫的要小心罗,爬数据要被判刑滴

2018-06-20 17:43:25 +08:00
 norain

万金油罪名:非法入侵计算机系统

http://tech.sina.com.cn/csj/2018-06-19/doc-iheauxvz7582325.shtml

28793 次点击
所在节点    程序员
68 条回复
liuxu
2018-06-20 19:05:42 +08:00
以后不要随便按 f5 了,按多了也会导致服务器其他用户缓慢,要判刑的
vuser
2018-06-20 19:06:50 +08:00
宋某这是被抓后又入职了老东家吗
Baymaxbowen
2018-06-20 19:06:56 +08:00
计算机入侵还真是滑稽
baoshuai33
2018-06-20 19:54:01 +08:00
百度整天爬别人,是否也可以告他
koalli
2018-06-20 19:55:31 +08:00
爬取了不下载呢?
vitalis
2018-06-20 21:18:10 +08:00
虾扯蛋,谷歌百度都该关咯。再说谁入侵你系统了?码农的事儿怎么能说是入侵?这是有礼貌的请求,你也可以不答应啊。。。
vitalis
2018-06-20 21:19:08 +08:00
楼主有标题党嫌疑哦
torbrowserbridge
2018-06-20 21:30:02 +08:00
记得之前有人提供酸酸乳服务,也是这个罪名哦
ReinWD
2018-06-20 22:07:28 +08:00
网站公开的数据 正常用户和爬虫都是一个一个请求向服务器发,服务器一个一个回应
本质上没有任何区别
都是合法的流程, 怎么就扯上爬虫的事了

案子的重点应该放在那些被爬下来的数据的流向上
爬下来自己看 和正常用户分开发请求一个一个视频看基本没啥区别 但是爬下来传播出去是侵权
错的是内容利用 而不是爬虫技术本身

看这篇说的就像是“用户利用我们公开的 API 吃了我们的一堆带宽”
和 DDoS 比较像
还是有相应的策略可以防范的
责任并非全在爬虫
JohnChu
2018-06-20 22:14:45 +08:00
为了破解头条的反爬技术,侯某等人伪造了 UA ( useragent 的缩写,意思就是“用户身份”)来绕过。
ihancheng
2018-06-20 22:19:53 +08:00
robots ?
IceCola1
2018-06-20 22:24:37 +08:00
useragent 可还行
crab
2018-06-20 22:28:57 +08:00
早就这样了。折腾 BAT 等大公司有关的,都要注意的。
applehater
2018-06-20 22:52:37 +08:00
今日头条的内容是自己生产的?不也是爬来的吗?
whoami9894
2018-06-20 23:33:10 +08:00
原来有人自己买服务器搭$$r,被判了三年,也是非法入侵计算机系统罪
whoami9894
2018-06-20 23:35:44 +08:00
@JohnChu
说的今日头条的反爬这么弱鸡的吗 hhh
Cu635
2018-06-21 00:48:49 +08:00
@Removable
一般而言是获利的才管。
mario85
2018-06-21 00:52:11 +08:00
人在江湖身不由己
xinleibird
2018-06-21 00:56:23 +08:00
唉,千言万语不如闭嘴。看看现实再看看各种吹,够魔幻的了。
gleymonkey
2018-06-21 01:10:21 +08:00
想定你的罪,会给你解释机会吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/464477

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX