求教一个替换文本中所有中文字符的问题?

2015-09-28 16:07:29 +08:00
 Nagisa1992
工作中一个问题,现在我要把 html 代码中所有的中文替换成另一种形式,比如说 alert (”再见!“)
现在要把”再见“替换成<{再见}>,即 alert (”<{再见}>!“)这种应该怎么做?有很多个文件都要这样弄,而我只会用最蠢的办法一个个去改。感觉正则表达式好像可以做到,但是百度了一下还是没有思路,求教
2351 次点击
所在节点    问与答
4 条回复
aec4d
2015-09-28 16:20:14 +08:00
中文字符的 unicode 是连在一起的
u ”[\u4e00-\u9fa5]+”可以表示一个或者多个中文字符
pmpio
2015-09-28 16:23:35 +08:00
@aec4d 全角的“!”也属于那个范围,所以他那个挺麻烦的,如果将所有""内的字串视为一体就好办。。。
oott123
2015-09-28 17:20:27 +08:00
总感觉楼主在做国际化…
这种活还是尽量手工过一遍好,长教训 233
JohnH
2015-09-28 17:29:31 +08:00
使用这样的正则
[^\x00-\xff]+
匹配双字节的字符

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/224280

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX