python 怎么过滤 emoji 表情符号呢

2016-04-27 16:13:01 +08:00
 wdg8106
看一篇文章写的, emoji 的 区间为 \u1F601-\u1F64F ,
然后我用正则表达式
re.compile(u'[\uF601-\u1F64F]').sub(u'',name)
进行过滤,并没有起到效果呢,请问大家遇到表情符号是怎么解决的呢
11166 次点击
所在节点    Python
2 条回复
GPU
2016-04-27 16:21:29 +08:00
try:
# UCS-4
Emoji = re.compile(u'[\U00010000-\U0010ffff]')
except re.error:
# UCS-2
Emoji = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]')
name = Emoji.sub(u'\u25FD', name)

By @sciooga
Khlieb
2016-04-27 21:17:20 +08:00
Emoji 其实不止一个区间
https://en.wikipedia.org/wiki/Emoji

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/274818

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX