目前支持 Unicode 的编程语言都有哪些?

2014-05-02 21:09:23 +08:00
 jakwings
PS:假如维基百科的大大们路过,希望顺便添加一个相关词条。
5296 次点击
所在节点    程序员
29 条回复
est
2014-05-03 08:56:26 +08:00
@timothyqiu 也不对。python2可以编译时候指定

--enable-unicode=ucs4

>>> import sys
>>> print sys.maxunicode
1114111



--enable-unicode=ucs2:

>>> import sys
>>> print sys.maxunicode
65535
lidashuang
2014-05-03 09:05:59 +08:00
elixir
timothyqiu
2014-05-03 09:26:46 +08:00
@est 呃~不大清楚哪里不对……

Unicode 码位范围是 U+000000 ~ U+10FFFF,于是:
ucs4 -> UTF-32 -> 0~1114111(0x10FFFF)
ucs2 -> UTF-16 -> 0~65535(0xFFFF)
est
2014-05-03 10:27:15 +08:00
@timothyqiu 额。看错了。你贴的是对的。
jakwings
2014-05-03 16:38:10 +08:00
@usedname PHP 从 5.4.3 开始就默认自带 Multibyte String 模块了,支持多种 Unicode 编码方式,有 mb_split 函数,也算是支持得比较好吧。
http://docs.php.net/manual/en/mbstring.encodings.php
jakwings
2014-05-03 16:43:17 +08:00
@lidashuang 谢谢。具体查了下是支持 UTF-8 的,对文本长度计算也似乎是准确的:
http://elixir-lang.org/docs/stable/String.html
zzNucker
2014-05-03 21:15:41 +08:00
wssgcg1213
2014-05-04 12:38:16 +08:00
ES6 codePointAt
jakwings
2014-05-06 16:20:41 +08:00
Lua5.3 也打算支持 UTF-8 : http://www.lua.org/work/doc/manual.html#6.5

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/110893

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX