如何把一篇文章里的汉字分别存到数组中去呢

2014-08-23 23:16:55 +08:00
 jacob
有没有这种工具或者方法,我给定一篇文章,他能把汉字以外的字符过滤出去,当然这个简单,然后把每个汉字存到数组里。
2417 次点击
所在节点    问与答
6 条回复
cxe2v
2014-08-23 23:23:47 +08:00
好像正则表达式可以匹配汉字
ETiV
2014-08-23 23:24:48 +08:00
在本页执行:

console.log($('.topic_content').text().match(/[\u4E00-\u9FFF]/g));
jacob
2014-08-24 00:03:49 +08:00
@ETiV 我现在用手机,没法试验,但你这个是jquery,输出汉字吧
xjx0524
2014-08-24 00:17:13 +08:00
@jacob 楼上那个方法的核心是/[\u4E00-\u9FFF]/g这个正则表达式,你换成你想用的语言就行了
ETiV
2014-08-24 01:37:21 +08:00
@jacob LS说的对

jQuery 的目的只是抓你帖子里的文字, 交给后面 match 正则表达式.

主要的是 match 括号里的, 和正则最后的 g
itfanr
2014-08-24 07:58:03 +08:00
用go语言也不错

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/129531

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX