怎么根据 unicode 编码,匹配到中文全角符号?

2019-12-13 20:01:52 +08:00
 miniyao
查了下,看到中文文字的 unicode 编码范围在 [\u4e00-\u9fa5],中文全角符号的 unicode 编码,也可以有编码范围可以查到吗?
2155 次点击
所在节点    问与答
4 条回复
crab
2019-12-13 20:09:47 +08:00
FF00-FFEF
ynyounuo
2019-12-13 20:18:53 +08:00
CJK Symbols and Punctuation
Range: 3000–303F
kerr92
2019-12-13 20:24:30 +08:00
去 Unicode 官网可以查到,另外 U+4E00–U+9FFF 只是 CJK 基本字符集,不是所有中文汉字
imn1
2019-12-13 21:07:26 +08:00
是时候 share 一下我的笔记了

================
CP65001, UTF-8
CP936, GBK
CP54936, GB18030
CP51936, EUC-CN
CP950, BIG5
CP932, SHIFT-JIS
CP51932, EUC-JP
CP949, ks_c_5601-1987
CP51949, EUC-KR
CP1252, ISO-8859-1


零宽空格
​ -->200B

汉字
常用 4E00-9FCF
extend A 3400-4DBF
extend B 20000-2A6DF
extend C 2A700-2B73F
extend D 2B740-2B81F
bopomofo(变形符号) 31A0-31BF
其他(带汉字符号) 3190-319F

CJK Unified Ideographs (4E00 – 9FFF )
CJK Unified Ideographs Extension A (3400 – 4DBF)
CJK Unified Ideographs Extension B (20000 – 2A6DF)
CJK Unified Ideographs Extension C (2A700 – 2B73F)
CJK Unified Ideographs Extension D (2B740 – 2B81F)
CJK Unified Ideographs Extension E (2B820 – 2CEAF)
CJK Unified Ideographs Extension F (2CEB0 – 2EBE0)

CJK Compatibility (3300 – 33FF ) 一些中日韩日常符号 /单位
CJK Compatibility Forms (FE30 – FE4F ) 全角半角符号
CJK Compatibility Ideographs (F900 – FAFF ) 补充汉字
CJK Compatibility Ideographs Supplement (2F800 – 2FA1F ) 补充汉字

CJK Radicals Supplement Range: 2E80–2EFF 偏旁部首
Kangxi Radicals Range: 2F00–2FDF 康熙部首
Ideographic Description Characters Range: 2FF0–2FFF 字体结构(形状符号)
CJK Strokes Range: 31C0–31EF 笔划


藏文 0F00-0FFF

蒙文 1800-18AF

日文
平假(全角) 3040-309F
片假(全角) 30A0-30FF
其他
31F0-31FF
FF66-FF9D (半角片假)
1B000-1B0FF

朝鲜文
AC00-D7AF (主体字符)
3130-318F (朝鲜语字首)
FFA0-FFDF (半角,范围不详)
A960-A97F
D7B0-D7FF

关于全角符号
常用标点符号 FF00-FFEF (排除上述重复的半角日韩)

自定义
E000-F8FF
F0000-FFFFF
100000-10FFFD

2E80 ~ 33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。
3400 ~ 4DFFh:中日韩认同表意文字扩充 A 区,总计收容 6,582 个中日韩汉字。
4E00 ~ 9FFFh:中日韩认同表意文字区,总计收容 20,902 个中日韩汉字。
A000 ~ A4FFh:彝族文字区,收容中国南方彝族文字和字根。
AC00 ~ D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。
F900 ~ FAFFh:中日韩兼容表意文字区,总计收容 302 个中日韩汉字。
FB00 ~ FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/628869

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX