GFW 专用白名单列表

2014-10-17 01:05:37 +08:00
 breakwa11

我写了一个Spider,自动收录常见国内网站域名作为白名单,国外自动使用代理,这样规则就不需要经常维护了。特别适合iOS自动代理配置和PC浏览器使用。而部分不需要代理且经常上的国外网站,需要手工加入列表。

由于使用域名匹配,DNS被污染也能正常使用。

列表地址

https://github.com/breakwa11/gfw_whitelist/blob/master/whitelist.pac

项目地址

https://github.com/breakwa11/gfw_whitelist

使用方法

下载 whitelist.pac 文件后,修改代理服务器的 ip 地址和代理类型。然后将浏览器的代理设置中指向 whitelist.pac

var proxy = 'PROXY www.abc.com:443'; // 需要更换成有效的代理地址,代理类型还可以为'SOCKS5'或'HTTPS'

求改进意见

7728 次点击
所在节点    分享创造
26 条回复
gqfBzoLVY3Wl4Tng
2014-10-17 02:17:49 +08:00
cow比较好用,list不用全部更新,需要就自动加进去,长期不访问就删除 挺好
Tink
2014-10-17 02:23:58 +08:00
apple.com 和 amazon.com是走墙内还是墙外
breakwa11
2014-10-17 02:34:48 +08:00
@Tink 走代理,只加了国内的域名
breakwa11
2014-10-17 02:35:20 +08:00
@pierrecpen pac怎么实现cow?
gqfBzoLVY3Wl4Tng
2014-10-17 02:38:00 +08:00
@breakwa11 ios mac不清楚 (估计把cow部署在国内服务器上就可以用)
pc

# HTTP (提供 http 代理):
# listen = http://127.0.0.1:7777
#
# 上面的例子中,cow 生成的 PAC url 为 http://127.0.0.1:7777/pac
gqfBzoLVY3Wl4Tng
2014-10-17 02:40:14 +08:00
@breakwa11 cow是检测墙了,自动添加list,白名单维护成本太高,可以效仿cow模式?
breakwa11
2014-10-17 02:46:07 +08:00
@pierrecpen 但是服务器根本不知道客户端访问了什么
hzlzh
2014-10-17 02:47:12 +08:00
可以收录一下:hzlzh.com 墙了好几年了
breakwa11
2014-10-17 02:51:16 +08:00
@hzlzh 这是白名单,收录的是没有被墙的域名
changsha
2014-10-17 07:19:37 +08:00
白名单....太多l q
zeroday
2014-10-17 13:01:54 +08:00


测试时,发现这个被墙,
anyfc
2014-10-17 15:19:48 +08:00
一万4千多条。。。
breakwa11
2014-10-17 15:52:16 +08:00
@zeroday 这个是啥?

@anyfc 等数据收集的差不多了再从中过滤出较常用的就会好多了
zeroday
2014-10-17 17:19:31 +08:00
breakwa11
2014-10-17 18:01:03 +08:00
@zeroday 这域名并不在列表里,所以应该代理连接啊,我访问这个没有问题。你用黑名单列表没有把那个域名加在你自己的列表吧?
Actrace
2014-10-19 23:40:25 +08:00
国内大多数视频网站的资源地址都是直接用服务器IP的...
breakwa11
2014-10-20 09:58:04 +08:00
@Actrace pac代码里对于ip都是直连的
Actrace
2014-10-20 10:02:30 +08:00
@breakwa11 这样一刀切不太好吧..如果有一些IP也是需要翻出去的话...
breakwa11
2014-10-20 11:47:05 +08:00
@Actrace 对于这个我有搜索过现成的黑名单列表,发现没有独立的ip条目,所以似乎目前没有设置的必要,国外常见的视频网站都不像国内这样直接用ip,都带有域名的。如果真出现ip访问而那个ip被屏蔽的情况,那么以目前pac的执行性能,也并不合适做精确的国内ip匹配。

我自己目前的方案是白名单直连(我在维护这个白名单),黑名单用代理,均不在的使用动态代理。如果发现真有ip是有这种情况,那么把这个pac里匹配ip的代码去掉即可。黑白名单主要用来提升动态代理的执行性能。
breakwa11
2014-10-22 15:15:25 +08:00
@xream @usufu @SoloCompany @Leask 综合了以上几位大牛的研究成果,构造了新的IP段查询算法,以O(1)的查询效率比原来二分查询要快两个数量级

代码刚才调整了一下,新的测试结果(100,000次查询):
firefox:
whitelist.pac 57ms
whiteiplist.pac 77ms

chrome:
whitelist.pac 63ms
whiteiplist.pac 90ms

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/139435

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX