收集了一些各大网站 Python 的登陆方式,希望对学习 Python 的小白,和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式

2019-03-06 18:37:32 +08:00
 CriseLYJ

各大网站登陆方式

模拟登录一些常见的网站

主要基于以下的 Python 的第三 library

  1. requests
  2. selenium
  3. rsa
  4. phantomjs

项目地址

Github

关于

模拟登陆基本采用的是直接登录或者使用 selenium+webdriver 的方式,有的网站直接登录难度很大,比如 qq 空间,如果采用 selenium 就相对轻松一些。

虽然在登录的时候采用的是 selenium,为了效率,我们可以在登录过后得到的 cookie 维护起来,然后调用 requests 或者 scrapy 等进行数据采集,这样数据采集的速度可以得到保证。

已完成

tips of pull request

问题

另外

欢迎你们

  1. 项目写了一段时间后,发现代码的风格和程序的易用性,可扩展性,代码的可读性,都存在一定的问题,所以接下来最重要的是重构代码,让大家可以更容易的做出一些自己的小功能。
  2. 如果你觉得某个网站的登录很有代表性,欢迎在 issue 中提出
  3. 如果网站的登录很有意思,我会在后面的更新中加入
  4. 网站的登录机制有可能经常的变动,所以当现在的模拟的登录的规则不能使用的时候,请在 issue 中提出

项目地址

Github

3284 次点击
所在节点    Python
12 条回复
CriseLYJ
2019-03-06 18:41:48 +08:00
水一下
levon
2019-03-06 18:49:46 +08:00
tumbzzc
2019-03-06 18:51:02 +08:00
你这代码是什么时候的? V2EX 登录都不用识别验证码的吗?
tumbzzc
2019-03-06 18:59:59 +08:00
之前研究过 bilibili 的登录,然后看到楼主的验证码是这种格式: https://passport.bilibili.com/captcha.gif?r=1551869855&type=login
然后


加上 bilibili 都是滑动验证码,不知道楼主这代码是哪里抄的
CriseLYJ
2019-03-06 19:09:58 +08:00
有的接口失效了,还没有重构。。
Tink
2019-03-06 19:10:06 +08:00
能用吗
tumbzzc
2019-03-06 19:10:26 +08:00
再看了知乎的登录代码,楼主的代码要么是抄的,要么是老到不能再老的代码。
鉴定完毕
CriseLYJ
2019-03-06 19:13:58 +08:00
@tumbzzc 说了是收集的,有的接口可能不能用,不过我最近会给做重构的...........................
tumbzzc
2019-03-06 19:17:47 +08:00
@CriseLYJ 未经验证过的接口,发出来有什么用,就我看的上面几个,没有一个能用的,有些代码可能都是几年前的
CriseLYJ
2019-03-06 19:25:13 +08:00
@tumbzzc 行吧 我会弄好了再发出来吧。。。。打扰了
kaikai5601
2019-03-06 19:34:38 +08:00
@CriseLYJ lz 是好心,先感谢下,但是未验证的打出来误导别人的
CriseLYJ
2019-03-06 19:48:02 +08:00
@kaikai5601 多谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/541855

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX