问下, Python 爬取指定网站,怎么样才算是违法的 ?

303 天前
 consensus

自学 python ,爬取了一下这个网站 https://www.boohee.com/food , 然后几分钟过去了,看还没结束,就点暂停了,这算不算违法了 ?有点懵 频率:在获取食物详情的时候,一秒一下请求

806 次点击
所在节点    问与答
7 条回复
LeegoYih
303 天前
Eiden
303 天前
这撑死几千条吧, 别人未必能发现, 但是你拿去盈利就不好说了
mumuuu
303 天前
https://www.boohee.com/robots.txt
先看下这个文件
然后不要大流量导致他网站受到影响
不要使用他有版权的内容盈利
最主要的,他不报警就不犯法
rimutuyuan
303 天前
灵活违法
consensus
303 天前
@LeegoYih @mumuuu
看了下 我请求的是 /shiwu/*,路径下的,好像并不在 Disallow 的范围内
谢谢 🙏

@Eiden
不会盈利的,只是弄着玩的
isSamle
303 天前
1.搞个 IP 代理池 2.降低采集频率,那你不说谁知道,有些事情是可以做不可以说的
consensus
303 天前
@isSamle 感谢,了解了 /doge

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1017916

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX