html entities 和 unicode 怎样的一个关系?

2016-05-24 10:24:32 +08:00
 rebeccaMyKid

我的理解: html entities 是 unicode 的一些常用字符的简化编码(或者叫转义?)?所以 html entites 的代码只对应 unicode 字符集吗?如果换了 gbk 字符集呢?可以直接在 html 中用 unicode 码么?

1525 次点击
所在节点    问与答
10 条回复
JerryTechtree
2016-05-24 14:19:38 +08:00
HTML Entities 跟 UNICODE 没啥关系

HTML Entities 是为了输出比如<这种在 HTML 语言中有特殊意义的字符, 类似&lt;或&#60;这些

与 UNICODE 相同类型的是 GBK, ASCII 这些字符集
jsonline
2016-05-24 14:37:03 +08:00
你可以用 Entities 显示任意 Unicode 字符
imn1
2016-05-24 14:41:55 +08:00
&#<数字>; 这种形式还是有关系的,这个数字就是 unicode 的整数值

但这里要有个清晰的概念: unicode 不是编码,它更多应该看作是一个字符映射表, utf-8/utf-16/uc2/utf-7...之类才是编码

根据上面所说的概念, html entities 和 gbk 或者 utf-8 没有对应关系,但 html entities 是可以显示 unicode 中对应的 gbk 字符
sox
2016-05-24 14:54:48 +08:00
又学到了一个
rebeccaMyKid
2016-05-25 08:54:44 +08:00
@jsonline 那所以 entities 是对应了 unicode 这一字符集做的了么?
jsonline
2016-05-25 15:18:47 +08:00
@rebeccaMyKid 看三楼
rebeccaMyKid
2016-05-25 23:48:48 +08:00
@jsonline 我觉得三楼说得不全对啊。我知道 unicode 是字符集不是编码,我这里说的 gbk 我指的也是一种字符集,如果这些 entities ,但有很多字符集啊,那 html entities 对应的哪个呢?不可能全部都通用啊。
jsonline
2016-05-25 23:53:18 +08:00
@rebeccaMyKid 对应一个
rebeccaMyKid
2016-05-25 23:56:08 +08:00
@jsonline 那就是说 html entities 是对应 unicode 字符集的了?
jsonline
2016-05-26 00:12:54 +08:00
@rebeccaMyKid &#<数字>; 这一个符合对应所有 Unicode 很难懂么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/280832

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX