目前正在完成一个维护代理 ip 池子的功能,代理 ip 来源之一是去定时爬取 其他提供代理 ip 的网站的数据。(~~比较 low,但这样基本爬下来的很多都能用 0.0)。还有一个来源是希望自己写一个扫描代理 ip 的程序,目前卡在如何找到可用的前两个网段,然后双层 for 循环一个一个去 访问 baidu 。有大佬有经验吗?
1
az999 OP 或者说哪位大佬写过扫描代理 ip 的程序的 0.0
|
2
chendajun 2017-04-20 17:13:52 +08:00
github 上大把,这种免费的代理 ip 可用性非常差。
|
3
codeface 2017-04-20 17:34:47 +08:00
先用 masscan 扫全球开放 8080 等常见代理端口的 IP
再去验证可用性 |
6
binux 2017-04-20 18:58:29 +08:00
@az999 #4 我确定「扫描代理 ip 的代码一大把」,但是我不确定他们在「 github 上大把」,毕竟很多历史都比 github 久远。
|
8
az999 OP 有没有哪位大佬给个思路哇。。。
|