Python 模拟各大网站登陆方式,以及一些爬虫程序,灰常适合学习爬虫的同学们哦!~~脚本几乎都是简单一点的,很容易上手,希望对小白有所帮助

2019-03-10 22:29:26 +08:00
 CriseLYJ

python 模拟各大网站登陆方式,以及一些爬虫程序

关于

项目地址

Github

Completed

show

Bilibili 自动登录测试正常,成功率 98%

web 微信

图虫 Spider

淘宝 web

Github

新增链家 Spider

1. 爬取淘宝各子标签,按销量排名商品信息,按分类保存至 MongoDB
2. 通过 pandas 进行数据分析
3 .将商品在各省分布、销量排行、地图分布等通过 matplotlib 绘图显示

guoke.spider 使用需谨慎,下载的比较快! 10 秒能下载一堆,截图我就不展示了,已经删除,东西太多了😝

微博

1. 输入要爬取的博主 ID,获取 ajax 请求
2. 解析 json 数据,爬取博主所有微博,保存至 MySQL

网易云音乐

知乎

1. 由于是你本地的 JScript 引擎只有一个默认的 JScript,所以会造成 json 未定义的错误。
2. execjs 会自动使用当前电脑上的运行时环境
3. 解决办法:安装一个 nodejs 的 V8 引擎就可以了

糗事百科

tips of pull request

3863 次点击
所在节点    Python
16 条回复
CriseLYJ
2019-03-10 22:40:15 +08:00
顶一下下
Baymaxbowen
2019-03-10 22:44:28 +08:00
哈哈哈已经 star,现在还看上了 LZ 终端的背景图,能分享吗?
zxcvsh
2019-03-10 22:45:08 +08:00
手动用户名密码....
CriseLYJ
2019-03-10 22:46:27 +08:00
@zxcvsh 不是手动 😓 录制 gif 的时候那边没录进去
zxcvsh
2019-03-10 22:47:06 +08:00
@zxcvsh 打错了...看成手动验证了;滑动验证是距离检查吗?
CriseLYJ
2019-03-10 22:48:02 +08:00
@Baymaxbowen 链接: https://share.weiyun.com/5p9GKeO 密码:w25g8b
拿走吧 昨天刚找到的图,挺喜欢的 哈哈
CriseLYJ
2019-03-10 22:50:23 +08:00
@zxcvsh 嗯嗯
CriseLYJ
2019-03-10 23:05:10 +08:00
好好学习
CriseLYJ
2019-03-10 23:26:09 +08:00
别沉
Allianzcortex
2019-03-10 23:27:04 +08:00
这是总结+原创吗?
VanderMark6
2019-03-11 03:54:04 +08:00
感谢分享
CriseLYJ
2019-03-11 08:54:22 +08:00
@VanderMark6 不用谢 哈
cat9life
2019-03-11 10:16:11 +08:00
这个可以有啊 1024
Heyavc
2019-03-11 10:27:34 +08:00
Nice Job,模拟登录值得学习,对一些自动化工程很有帮助。
CriseLYJ
2019-03-11 10:51:52 +08:00
@Heyavc 多谢支持
CriseLYJ
2019-03-11 10:52:04 +08:00
@cat9life 多谢支持

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/543118

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX