“纸”这个字的编码有什么特殊的地方吗?

2016-07-31 12:34:13 +08:00
 pinterest

和等号一起化为一个点,非常奇怪

譬如:
https://www.baidu.com/s?wd=ֽ

3112 次点击
所在节点    分享发现
21 条回复
viko16
2016-07-31 12:47:12 +08:00
查了一下,这个点似乎是希伯来语?
http://graphemica.com/05BD
vibbow
2016-07-31 12:48:29 +08:00
pinterest
2016-07-31 12:48:42 +08:00
@viko16 网站不错,收下了
Lonely
2016-07-31 12:53:15 +08:00
是我网有问题还是楼上两位的头像都是空白😒
pinterest
2016-07-31 12:56:21 +08:00
@Lonely 巧合,哈哈
imn1
2016-07-31 13:01:21 +08:00
@Lonely
再来一发
Lonely
2016-07-31 13:06:56 +08:00
@imn1 🙄
RqPS6rhmP3Nyn3Tm
2016-07-31 13:21:24 +08:00
>>> ord('纸')
32440
pinterest
2016-07-31 13:28:09 +08:00
@BXIA
那个希伯来语文字`ֽ`
=`=`
纸`纸`

有什么联系呢?
lizheming
2016-07-31 14:37:05 +08:00
因为点的 url 编码是 %D6%BD ,然后百度是使用 GBK 编码的,纸的 GBK 正好是 D6BD
pinterest
2016-07-31 15:08:15 +08:00
@lizheming 正解!!终于解惑了
另外: D6BD 毒瘤百度,哈哈啊哈哈(手动滑稽)
strwei
2016-07-31 15:30:45 +08:00
@viko16 网站不错,收下了
strwei
2016-07-31 15:31:06 +08:00
@viko16 网站不错,收下了
SmiteChow
2016-07-31 15:51:12 +08:00
@lizheming 厉害
lizheming
2016-07-31 16:14:22 +08:00
@pinterest 百度和淘宝这种大站为了节省流量使用 GBK 编码很久了~( UTF-8 的中文是 2-4 个字节的,而 GBK 2 个字节就能表示中文了 =w=)
kanezeng
2016-07-31 16:16:21 +08:00
@lizheming UTF-8 的中文至少 3 个字节吧
lizheming
2016-07-31 16:21:46 +08:00
@kanezeng 嗯,是的,有点尴尬,你就看成左开右闭区吧(逃....哈哈哈哈
RqPS6rhmP3Nyn3Tm
2016-08-01 01:46:22 +08:00
就和当年琨斤拷一样啊,还有烫烫烫
BlueMeow
2016-08-02 15:40:52 +08:00
@lizheming GBK 也有历史问题吧,当年百度一直是 GBK 的,也够用,就不改了。
lizheming
2016-08-02 19:17:15 +08:00
@BlueMeow 历史问题的占比非常小,因为内部的开发肯定全都是 UTF-8 的,为何要特地保留下 GBK 这才是更大的因素。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/296119

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX