// 这里理论上应该返回 false ,但神奇的是居然返回 true
console.log(/^[\u2F800-\u2FA1F]+$/.test('abc'));
我这边正在写 JS ,想使用正则来匹配中文。
最开始的范围为:[\u4E00-\u9FFF] 基本汉字,后面有朋友提醒 CJK 还有扩展 A 区块和扩展 B 区块,需要也加上去。
咨询了 GPT3.5 和查询了 wikipedia ,把这个正则的匹配区间增加了 A 区块、B 区块、补充区块等。
然后就遇到上面神奇的问题,[\u2F800-\u2FA1F] 是中日韩兼容表意文字补充,来源: https://zh.wikipedia.org/wiki/%E4%B8%AD%E6%97%A5%E9%9F%93%E5%85%BC%E5%AE%B9%E8%A1%A8%E6%84%8F%E6%96%87%E5%AD%97%E8%A3%9C%E5%85%85 ,共 542 个字。但不知道为什么,测试后总返回 true 。
请问哪位大佬知道为什么呢,求指点。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.