如何把一篇文章里的汉字分别存到数组中去呢

2014-08-23 23:16:55 +08:00

jacob

有没有这种工具或者方法，我给定一篇文章，他能把汉字以外的字符过滤出去，当然这个简单，然后把每个汉字存到数组里。

2437 次点击

所在节点

6 条回复

cxe2v

2014-08-23 23:23:47 +08:00

好像正则表达式可以匹配汉字

ETiV

2014-08-23 23:24:48 +08:00

在本页执行:

console.log($('.topic_content').text().match(/[\u4E00-\u9FFF]/g));

jacob

2014-08-24 00:03:49 +08:00

@ETiV 我现在用手机，没法试验，但你这个是jquery，输出汉字吧

xjx0524

2014-08-24 00:17:13 +08:00

@jacob 楼上那个方法的核心是/[\u4E00-\u9FFF]/g这个正则表达式，你换成你想用的语言就行了

ETiV

2014-08-24 01:37:21 +08:00

@jacob LS说的对

jQuery 的目的只是抓你帖子里的文字, 交给后面 match 正则表达式.

主要的是 match 括号里的, 和正则最后的 g

itfanr

2014-08-24 07:58:03 +08:00

用go语言也不错

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.