在 GitHub 上发现了个宝藏项目,超牛的爬虫工具箱

2020-09-11 23:01:10 +08:00
 zhc666

https://infospider.vercel.app

研究了一下,不错的爬虫项目,but 爬虫玩得好,牢饭吃到饱,不知道开发者在哪里吃饭

项目非常丰富的,里面包括了 GitHub 、QQ 邮箱、网易邮箱、京东、淘宝、支付宝、移动联通电信、知乎、B 站、网易云音乐、QQ 群以及各大技术论坛与社区的爬虫。

最棒的是所有的爬虫脚本相互独立,可以无缝移植到自己的项目中。

4594 次点击
所在节点    Python
6 条回复
Whalko
2020-09-11 23:12:56 +08:00
fengchang
2020-09-11 23:12:58 +08:00
项目很好啊,但是最缺的是人人网
learningman
2020-09-12 09:06:19 +08:00
用 webdriver 的,不方便啊
daum
2020-09-12 19:59:46 +08:00
怎么感觉在 SEO
wewewe
2020-09-13 08:50:04 +08:00
配合这个使用效果更好哦
https://www.v2ex.com/t/706327
hellolex
2020-09-13 18:12:44 +08:00
能拿到微博的就好了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/706291

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX