爬去大众点评

2018-08-23 21:26:04 +08:00

qybing

使用 Scrapy 爬取大众点评商铺信息（例如 URL： http://www.dianping.com/shop/19484059 ），在 def parse(self, response):函数里 response 的状态为 200，而内容却为空 body={byte} b 这是为什么

3036 次点击

所在节点

7 条回复

f2f2f

2018-08-23 21:35:55 +08:00

触发他家的安全机制了，直接返回空页面

vansl

2018-08-23 21:53:27 +08:00

大众点评需要控制好频率

qybing

2018-08-23 22:33:42 +08:00

@f2f2f 触发安全机制，不是应该到重定向到验证码的网页吗

f2f2f

2018-08-23 22:37:36 +08:00

@qybing 他家的重定向发生在已经进入到点评网站后。返回空白页是你直接 URL 访问的情况下。单位里公网 IP 就一个，经常遇到。

qybing

2018-08-23 22:39:53 +08:00

@f2f2f 加上 IP 代理，是否可以规避这个返回为空的问题

ksharp8

2018-08-23 22:47:02 +08:00

应该做了反爬虫处理，可以用 wireshark 抓一下包分析分析

qybing

2018-08-24 11:37:15 +08:00

我加上 IP 代理，返回为空，如果不加代理频繁访问为空，不频繁正常，这是哪里出现了问题，大佬们

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.