使用wget模拟登录时碰到验证码

2012-08-27 16:40:07 +08:00
 zjhui
我想用shell写个下载豆瓣fm上面歌曲的脚本,可是豆瓣在登录的时候用图片进行验证,貌似wget就不行了,是不是有chrome的插件能获得登录时的cookie,wget就可以直接使用这个cookie进行登录?或者还有其他什么办法?
5169 次点击
所在节点    Linux
7 条回复
egen
2012-08-27 17:51:11 +08:00
wget 可以保存和重新读入cookie,不过你下载到验证码之后怎么办?
zjhui
2012-08-27 19:36:24 +08:00
@egen 额..要不只能是先浏览器登录,然后拿登录以后的cookie给wget用?
gavingeng
2012-08-28 00:18:22 +08:00
@zjhui
用python脚本来保存cookie,然后在抓取你想要的歌曲!
用过curl 的post来做过登陆抓取,但不是captcha
egen
2012-08-28 00:32:46 +08:00
@zjhui 浏览器登录的cookie也能用,就是麻烦点,可以参考这篇文章
cabinw
2012-08-28 00:53:41 +08:00
@egen 文章没贴上来啊
egen
2012-08-28 12:01:56 +08:00
@cabinw 哈哈,sorry,不知道为什么没贴上来,这里:http://yp.oss.org.cn/software/show_resource.php?resource_id=962
YUCOAT
2012-08-28 15:28:58 +08:00
用Python的urllib2来替代wget吧,它好像可以设置Cookie

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/46152

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX