本来打算写一个 GitHub_Following 的爬虫,结果造了一个轮子,写了抓登录用户的 Star,Following,Follower,Repo 信息,说不定以后能用到哈哈
只是一个测试小样, todo 很多实在不好意思写了~
用了 requests 和 bs4 ,先安装这两个库然后再用
使用方法
python demo.py
然后在控制台输入邮箱和密码,根据自己需求改一下就好了,提供了以下的方法:
flag=True 表示代码自己加工输出信息,以 json 形式输出,反之则返回网页源码
用 user_repositories()的返回举个例子,根据是 source 还是 fork 分类
{
"sources": [
{
"repositories_url": "https://github.com//HolaJam/github_spider",
"repositories_name": "github_spider",
"repositories_programmingLanguage": "Python",
"repositories_description": "一个简单的 GitHub 爬虫 A Simple Spider for GitHub"
},
{
"repositories_url": "https://github.com//HolaJam/luowang",
"repositories_name": "luowang",
"repositories_programmingLanguage": "Python",
"repositories_description": "You Can Get Wonderful Music."
},
],
"forks": [
{
"repositories_url": "https://github.com//HolaJam/head-first-flask",
"repositories_name": "head-first-flask",
"repositories_programmingLanguage": "Null",
"repositories_description": "Introduction to Flask Web development."
},
{
"repositories_url": "https://github.com//HolaJam/gitblogdoc",
"repositories_name": "gitblogdoc",
"repositories_programmingLanguage": "PHP",
"repositories_description": "gitblog 文档"
},
{
"repositories_url": "https://github.com//HolaJam/ToughRADIUS",
"repositories_name": "ToughRADIUS",
"repositories_programmingLanguage": "JavaScript",
"repositories_description": "TOUGHRADIUS 是一个开源的 Radius 服务软件,支持标准 RADIUS 协议,提供完整的 AAA 实现。支持灵活的策略管理,支持各种主流接入设备并轻松扩展,具备丰富的计费策略支持。"
},
{
"repositories_url": "https://github.com//HolaJam/MyPlatform",
"repositories_name": "MyPlatform",
"repositories_programmingLanguage": "Python",
"repositories_description": "文科生也会配的微信个人号后台, Content based wechat massive platform framework, what you need to do is only adding your articles in :)"
},
{
"repositories_url": "https://github.com//HolaJam/Web-Crawler",
"repositories_name": "Web-Crawler",
"repositories_programmingLanguage": "Python",
"repositories_description": "是一种“自动化浏览网络”的程序,或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。"
},
}
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.