求一个模拟新浪登录爬虫

2014-06-05 09:10:23 +08:00
 4gShell
学习python,求一个模拟新浪登录的爬虫,研究学习。
5052 次点击
所在节点    Python
11 条回复
shoumu
2014-06-05 09:18:51 +08:00
很久之前写过一个,但是现在已经不能用了
RelativeLayout
2014-06-05 09:24:34 +08:00
https://github.com/daimajia/social-auth-simulator

很早的时候自己做了一个,刚才测试了下 还能用。

得sudo pip install BeautifulSoup4 和 requests. 然后在

https://github.com/daimajia/social-auth-simulator/blob/master/Weibo/local/test.py

填上自己的用户名和密码就可以测试了。
RelativeLayout
2014-06-05 09:26:32 +08:00
因为当时考虑到了很多未来微博可能变化的细节,表单的提取都是动态的,而不是写好的。所以机动性更强一些。
humiaozuzu
2014-06-05 09:32:09 +08:00
@RelativeLayout 登陆有时会出现验证码
RelativeLayout
2014-06-05 09:37:24 +08:00
@humiaozuzu 我这个貌似可以绕过哦~
4gShell
2014-06-05 09:39:58 +08:00
@RelativeLayout 谢谢啦
youyudehexie
2014-06-05 10:15:33 +08:00
@humiaozuzu 只要设置号常用登录地区就可以
airbob
2014-06-05 10:52:01 +08:00
@RelativeLayout 谢谢,正好也需要这个
Ansen
2014-06-05 11:07:39 +08:00
pyshift
2014-06-05 11:54:42 +08:00
推荐爬cn端,压力小。时间间隔设置出去。而且明文不用转码,com端是unicode编码的。标签自己分析一下,正则一下就好了。自己刚做完一个新浪的爬虫=。=应付毕设。
linsk
2014-07-02 17:12:36 +08:00
@pyshift 有没有办法爬一个账户的微信好友圈里的内容?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/115873

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX