爬去大众点评

2018-08-23 21:26:04 +08:00
 qybing
使用 Scrapy 爬取大众点评商铺信息(例如 URL: http://www.dianping.com/shop/19484059 ),在 def parse(self, response):函数里 response 的状态为 200,而内容却为空 body={byte} b 这是为什么
3010 次点击
所在节点    Python
7 条回复
f2f2f
2018-08-23 21:35:55 +08:00
触发他家的安全机制了,直接返回空页面
vansl
2018-08-23 21:53:27 +08:00
大众点评需要控制好频率
qybing
2018-08-23 22:33:42 +08:00
@f2f2f 触发安全机制,不是应该到重定向到验证码的网页吗
f2f2f
2018-08-23 22:37:36 +08:00
@qybing 他家的重定向发生在已经进入到点评网站后。返回空白页是你直接 URL 访问的情况下。单位里公网 IP 就一个,经常遇到。
qybing
2018-08-23 22:39:53 +08:00
@f2f2f 加上 IP 代理,是否可以规避这个返回为空的问题
ksharp8
2018-08-23 22:47:02 +08:00
应该做了反爬虫处理,可以用 wireshark 抓一下包分析分析
qybing
2018-08-24 11:37:15 +08:00
我加上 IP 代理,返回为空,如果不加代理频繁访问为空,不频繁正常,这是哪里出现了问题,大佬们

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/482667

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX