我是如何把网站图片 cdn 流量成本压到全网最低(之一)的

2022-09-05 09:32:44 +08:00
 star7th

缘起

我经营的一些网站和产品的访问量越来越高,付出的 cdn 流量成本(主要是图片资源)也越来越大。抱着节省成本的想法,我尝试在网络上找下有没有便宜的 cdn 商家。 像阿里云、腾讯云、七牛云,这些公有云 cdn 的价格都大同小异,我感觉即使从这一家换到另一家,也节省不了多少成本,同时还增加了迁移的麻烦。因此我把目光投向传统机房,预感可能越接近机器底层,能优化的空间越大。

经过几天的考察,发现很多非热门地区的机房都或多或少都有一些闲置的优惠产品,甚至其中也不乏优质带宽机器。特别是三四线机房,线路测试其实还不错。很明显这些闲置资源没有得到充分利用。一个点子在我脑海中酝酿了。

使用开源 or 自己原创?

假如我把各地的闲置机器组织起来,把它们当成一个个节点,组建起一个分布式网络,自动容灾切换,岂不就是一个廉价的自建 cdn 方案了? 顺着这个思路,我去找一下开源的 cdn 软件 ,看看有没有现成的解决方案。

然而事情没有我想的那么简单。开源 cdn 并没有很好的容灾切换机制,无法实时避障。 它核心原理里,用域名 cname 的方式指向某个节点 ip ,当节点挂了的时候,由于域名 cname 解析变更有 10 分钟以上的缓存,所以必定会导致用户有一段时间的访问故障。 我现在探索的是把各地机房集成到一起,其中机器节点的可靠性是参差不齐的。如果想做成一套 cdn ,那么就必须要假设节点是不可靠的,随时可能故障的,然后为此设计一套完善的容灾解决方案。

既然找不到现成的开源解决方案,那就自己动手写代码实现吧。

基本逻辑

我边啃着玉米,边用笔在纸上画着逻辑交互图。 经过一阵子的反复斟酌,基本逻辑已经成型。

1 ,这套程序主要有两个角色,调度服务器和节点服务器。调度服务器架设在阿里云 k8s 上,保障高可用。而节点服务器则是分布在各地机房,做好可能会故障、随时容灾切换的准备。

2 ,调度服务器的作用是导流和容灾,将用户流量以重定向的方式导向可用的节点,同时避开故障节点,做到实时无缝切换。

3 ,节点服务器的主要作用是拉取源文件到本地缓存,从而被用户访问。

4 ,节点服务器跟调度服务器之间要用某 tcp 协议实时连接监控,监控粒度细分到每个文件,方便调度服务器实时避开故障节点,这样才能保证故障时候,用户访问的每个链接都可以正常切换访问。这里实时性是非常重要的,也是容灾方案的核心。

小试牛刀

于是我花了一个多月的时间去写代码来实现这个逻辑。核心代码其实写得很快,但是为了保障稳定性,增加了非常多的异常容灾措施,要花时间不断测试不断重写。 初期只放三个异地机房节点,把流量切进来看看。 为了保险起见,先从小的做起。我一开始切日均 10G 流量过去,让它跑几天。 几天后,没问题。 试试日均 50G 流量? 50G 跑了几天,ok 。日均 300G ? 依然正常运行 。

开放商用

现在,已经完美运行了一个月,每天承受超过 1000G 流量,暂时没发现有故障现象。我以及一些朋友的很多产品都在用。我刻意关掉其中一个节点,调度服务器马上切流量到其他节点。我刻意关闭全部节点,流量也马上转到源站。整个过程中,只要调度服务器正常运作,那么,无论节点故障与否,用户都将继续无感知地正常访问图片。 而调度服务器直接运行在阿里云 k8s 上,可靠性是非常高的。因此整套架构的可靠性很高。

有了这个架构,如果需要承受更大流量,我只需要增加节点数即可。而全国范围内的机房机器多的是 ,我可以随时租机器来新增节点。当我意识到有规模化运作大流量的可能性后, 我决定把 cdn 能力包装出去 ,商业化运作。于是注册并备案了大风云网, 访问地址是 www.dfyun.com.cn

结语

大风云 www.dfyun.com.cn 严格来讲不是传统 cdn ,它是另一种内容分发机制,基于传统 cdn 以及传统机房机器, 用软件技术实现资源整合,是应用层面的一种微创新,在图片访问,文件下载等这些场景下可以成倍地降低流量成本 ,成本低于 0.05G/元 , 降低到公有云 cdn 价格的四分之一以下(只对比平时价格,不考虑搞活动的临时特价),几乎是全网 cdn 流量成本最低之一了。

27648 次点击
所在节点    分享创造
191 条回复
Xusually
2022-09-05 09:38:12 +08:00
showdoc 作者啊,支持一下。
villivateur
2022-09-05 09:38:47 +08:00
类似的东西大厂早就做了吧?叫 PCDN ,用客户端来作为节点,比你这个成本更低
Xusually
2022-09-05 09:38:56 +08:00
不过貌似应该发到 promotion 节点啊
VBk
2022-09-05 09:44:41 +08:00
@villivateur pcdn 不合法吧,大哥,现阶段其实好多 isp 都已经封锁这种行为了,实际上是薅家宽的羊毛。
star7th
2022-09-05 09:45:51 +08:00
@VBk
@villivateur

我是用正规机房机器,不会被运营商封。
enigmac
2022-09-05 09:46:05 +08:00
价格是不是弄错了 0.05G/元 ?
star7th
2022-09-05 09:48:33 +08:00
@Xusually 其实本文更多是分享创造的过程,也包含有产品的核心逻辑思路。只是最后放上一些链接来吸引下流量,不太严格的情况下,也可以说不算促销推广信息
star7th
2022-09-05 09:49:36 +08:00
@zainisthebestman 没弄错。你为啥会觉得我弄错了?
VBk
2022-09-05 09:52:31 +08:00
@star7th 应该是 0.05 元 /G 吧
star7th
2022-09-05 09:53:59 +08:00
@VBk 对哦,我写错顺序了。数字是对的,单位倒序了。
luzemin
2022-09-05 09:55:34 +08:00
@star7th 确实是你写错了,0.05G/元(本文)---> 0.05 元 /G (你的官网)
Xusually
2022-09-05 09:56:44 +08:00
@star7th 目前 PCDN 上的比较多了,京东云的 MCDN 这种,也是传统节点、用户海量节点混合调度的,成本也是非常低,具体价格肯定不到传统 CDN 的一半,没有实际用过不清楚可以做到什么程度,估计不会比 OP 这价格高多少。

我看 OP 的 demo 图片链接是一个接入系统后的跳转链接或者说是调度链接,是不是不方便保持既有 URI ,还是有 URI 改造成本?
gesse
2022-09-05 09:58:34 +08:00
我记得经营 cdn 貌似要相关拍照啊
stille
2022-09-05 10:00:02 +08:00
先收藏了,看起来有前景。
star7th
2022-09-05 10:00:25 +08:00
@Xusually 因为在我的设计方案里,是要保证“节点随时挂了”也能正常访问。所以,url 不能直接解析到节点 ip ,如果解析到的话,节点挂了,就挂了。而更高 dns 解析是有 10 分钟以上的延迟的。这个就会导致至少故障 10 分钟。所以,为了保证能实时避障,比如做 url 跳转。
star7th
2022-09-05 10:02:24 +08:00
@gesse 我本来就是用企业资质注册和备案网站的。牌照暂时是没申请。但是以后如果规模大了就申请吧。现在规模小,没人管这些。而且,我这个其实也不太算的上传统 cdn 服务,不过是一种流量转发思路而已。
Moker
2022-09-05 10:03:15 +08:00
动手能力真的强
Xusually
2022-09-05 10:03:47 +08:00
@star7th 嗯,那就是了。
自建我以前也尝试过,就是你说的,切 DNS 解析可能各地有缓存,快的可能一分钟就好了,小运营商不遵循 TTL 的,慢的半小时都不一定能切过来。
Xusually
2022-09-05 10:05:19 +08:00
当时也考虑做调度转发,不过想想如果量小能接受 TTL 切换的 downtime 的话,那做了没意义。
量大的话,直接用商用方案成本也不太敏感了。

OP 这产品算是卡了一个位。
billzhuang
2022-09-05 10:06:56 +08:00
你这个别人可以在你这儿接入备案么?

感觉已经算 IDC 了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/877718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX