用 Scrapy 爬知乎,验证码总是错误。

2014-12-06 13:19:59 +08:00
 DrakeLeung
我已经获取了验证码图片的地址,然后显示来,并手动输入。

但是验证码还是错误?为什么
7564 次点击
所在节点    Python
11 条回复
bohan
2014-12-06 13:40:05 +08:00
肯定是提交的有问题啊
DrakeLeung
2014-12-06 13:46:36 +08:00
@bohan 我看过他的请求,他需要的field,我都传了。有没有可能是加密问题?
22too
2014-12-06 14:07:05 +08:00
有可能是验证码加密,这个你真没辙,
whywhywhy
2014-12-06 14:11:55 +08:00
是不是没处理cookie
DrakeLeung
2014-12-06 14:45:56 +08:00
@whywhywhy 怎么处理cookie?用了帐号密码还需要处理cookie吗
bohan
2014-12-06 21:45:51 +08:00
如果请求都一样,那有可能就是cookie的问题了
onlyice
2014-12-07 19:28:27 +08:00
上代码?一起研究下
lfyzjck
2014-12-09 12:46:12 +08:00
Scrapy应该能自动处理Cookie,每个请求应该都是带上Cookie的,可以开DEBUG看看。

http://doc.scrapy.org/en/latest/topics/downloader-middleware.html#cookies-mw

每次请求获取验证码接口的时候,服务端对应的『正确结果』都会被刷新,所以注意别在提交验证码前再次请求获取验证码
DrakeLeung
2014-12-09 17:52:24 +08:00
@lfyzjck 你说对了!!好棒!!但是怎样才能显示一个图片出来啊?我现在用的方法是: http://stackoverflow.com/questions/7391945/how-do-i-read-image-data-from-a-url-in-python

但是这种方法就像你所说的,需要再次请求验证码。所以验证码和页面那个不一样了。

所以,有没有其他方法读取HTML里的图片,并显示出来?
DrakeLeung
2014-12-09 17:56:28 +08:00
@onlyice 好啊。看我回复楼下的。
reloop
2015-01-28 10:00:05 +08:00
最后 , 问题是怎么解决的?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/151930

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX