问下， Python 爬取指定网站，怎么样才算是违法的？

343 天前

consensus

自学 python ，爬取了一下这个网站 https://www.boohee.com/food ，然后几分钟过去了，看还没结束，就点暂停了，这算不算违法了？有点懵频率：在获取食物详情的时候，一秒一下请求

841 次点击

所在节点

7 条回复

LeegoYih

343 天前

Eiden

343 天前

这撑死几千条吧, 别人未必能发现, 但是你拿去盈利就不好说了

mumuuu

343 天前

https://www.boohee.com/robots.txt
先看下这个文件
然后不要大流量导致他网站受到影响
不要使用他有版权的内容盈利
最主要的，他不报警就不犯法

rimutuyuan

343 天前

灵活违法

consensus

343 天前

@LeegoYih @mumuuu
看了下我请求的是 /shiwu/*，路径下的，好像并不在 Disallow 的范围内
谢谢 🙏

@Eiden
不会盈利的，只是弄着玩的

isSamle

343 天前

1.搞个 IP 代理池 2.降低采集频率，那你不说谁知道，有些事情是可以做不可以说的

consensus

343 天前

@isSamle 感谢，了解了 /doge

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

问下， Python 爬取指定网站，怎么样才算是违法的 ？