Python 爬虫问题

2018-06-17 11:34:00 +08:00
 bestehen
我在爬企查查的时候,被反爬后,手动解决滑块后 然后 重新爬,发现状态码是 200,但是返回的数据是空,换了一台电脑,同样 ip 同样账户,可以返回数据,请问这是为啥呢?

我之前爬的时候也遇到这种问题,都是重新安装系统解决的
3228 次点击
所在节点    Python
10 条回复
gitopen
2018-06-17 11:50:22 +08:00
重装系统解决的😂
wuqiangroy
2018-06-17 12:05:57 +08:00
切换 ip 看看数据是否为空。
lhx2008
2018-06-17 12:10:19 +08:00
返回 200≠解决了反爬,可能是 headers/js 侦测,企查查反爬可以说是中国数一数二了
bestehen
2018-06-17 13:46:56 +08:00
@wuqiangroy 我两台电脑在一个局域网的
bestehen
2018-06-17 13:47:35 +08:00
@lhx2008 关键两台电脑 ip 账户都一样,一个可以返回,一个不可以
JCZ2MkKb5S8ZX9pq
2018-06-17 14:51:10 +08:00
@bestehen 那就检查提交的请求有啥不同咯
不过人家好坏是做爬虫出身的,反爬应该是很看重的吧。没准工商公示的反爬还弱一点。
bestehen
2018-06-17 15:39:03 +08:00
@JCZ2MkKb5S8ZX9pq 我以前也遇到过这种问题,我都是重装系统,就可以返回数据了,代码都是一样的
bestehen
2018-06-18 19:56:21 +08:00
@JCZ2MkKb5S8ZX9pq 关键这种东西是怎么反爬的,我搞不懂
kingofvir
2018-07-01 12:15:53 +08:00
啥是“手动解决滑块”?
Dreamerwwr
2020-06-01 17:25:32 +08:00
请教下 “手动解决滑块” 是啥意思啊?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/463699

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX