[面试难题] 中文站点用 GBK 编码代替 UTF-8 编码,可以节约多少储存/带宽成本?

2018-06-09 11:53:55 +08:00
 nikoo
一个中文站点,平均 HTML 页面源代码(包含 JS/CSS )的中文与英文比例为 9:1
站点没有图片,所有流量皆为 HTML 页面流量

目前使用的是 UTF-8 编码
内容储存成本 1,000/月
流量带宽成本 10,000/月

那么请问如果将该站改为 GBK 编码,如何计算修改后其储 /带宽成本?

求教各位,这个问题题库里从没见过,网上也搜不到答案,直接蒙圈了
5114 次点击
所在节点    问与答
44 条回复
nikoo
2018-06-10 00:02:18 +08:00
@imn1 UTF-8 编码是否存在 2 字节的汉字?还是说汉字均为 3-4 字节?
mozutaba
2018-06-10 00:19:25 +08:00
@nikoo
占 2 个字节的:〇
占 3 个字节的:基本等同于 GBK,含 21000 多个汉字
占 4 个字节的:中日韩超大字符集里面的汉字,有 5 万多个
nikoo
2018-06-10 00:34:41 +08:00
@mozutaba 谢谢,有没有常用的汉字占 2 字节的?还是仅这个 〇 是 2 字节?
imn1
2018-06-10 00:37:06 +08:00
@nikoo
双字节的 utf-8 unicode 码为 80-07ff,这里面没有汉字

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/461697

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX