推广 Github 项目:爬取免费可用代理,供爬虫等工具使用

2017-09-04 11:58:57 +08:00
 ksaa0096329

proxy_list

很多网站对爬虫都会有 IP 访问频率的限制。如果你的爬虫只用一个 IP 来爬取,那就只能设置爬取间隔,来避免被网站屏蔽。但是这样爬虫的效率会大大下降,这个时候就需要使用代理 IP 来爬取数据。一个 IP 被屏蔽了,换一个 IP 继续爬取。此项目就是提供给你免费代理的。

需要免费代理的可以试试,如果对您有帮助,希望给个 Star ⭐,谢谢!😁😘🎁🎉

Github 项目地址 gavin66 / proxy_list

特性

使用

使用 Python3.6 开发的项目,没有对其他版本 Python 测试

克隆源码

git clone git@github.com:gavin66/proxy_list.git

安装依赖

pip install -r requirements.txt

运行脚本

python run.py

Web API

查看文档

8220 次点击
所在节点    Python
24 条回复
ksaa0096329
2017-09-05 09:46:28 +08:00
@flyingfz 再找其他的免费代理网站
jfry
2017-09-05 13:49:57 +08:00
顶 收藏备用
pengdu
2017-09-05 16:45:03 +08:00
楼主帮忙科普下:
1,爬虫是怎么使用 IP 代理的?
2,如何贡献自己的 IP 作为爬虫代理?

谢谢!
wingyiu
2017-09-05 22:47:03 +08:00
@est 干得漂亮

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/387991

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX