该代码集包含网页的普通爬取、字体反爬处理、二进制文件下载、常见的 Ajax 数据爬取、Selenium 模拟登陆、常见四字符验证码识别、极验滑动验证码的破解、点触式验证码的破解、App 爬取、Scrapy 项目等。对像我这种小菜鸟的帮助很大哦。
个人感觉,像我这样的菜鸟和菜鸟小哥哥可以 star,我们可以互相学习,完善代码库。
从 3 月 11 起开始更新。不仅提交新的代码(弹幕爬取、视频下载等),还会抽时间对旧代码进行更新,尽量保证代码的运行的过程不会出现 Bug。
https://github.com/Northxw/Python3_WebSpider
喜欢 Python, 喜欢爬虫,喜欢数据分析的童鞋可以来一起学习哦!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.