Python 2 里面怎么根据多个分隔符分裂字符串?

2014-10-12 15:02:59 +08:00
 Axurez
比如根据中文标点。”?……!把文段分成一个句子。。。
Python 2 里怎么实现呢?(编码好像总带来一些 bug)
6912 次点击
所在节点    问与答
2 条回复
imn1
2014-10-12 15:06:17 +08:00
用正则拆分
hahastudio
2014-10-12 15:10:23 +08:00
Google: Python split multiple delimiter
http://stackoverflow.com/questions/1059559/python-strings-split-with-multiple-delimiters

>>> import re
>>> s = u"我是一句话。你问我要不要被分割?不要啊!"
>>> print s
我是一句话。你问我要不要被分割?不要啊!
>>> re.split(u'。|?|!', s)
[u'\u6211\u662f\u4e00\u53e5\u8bdd', u'\u4f60\u95ee\u6211\u8981\u4e0d\u8981\u88ab\u5206\u5272', u'\u4e0d\u8981\u554a', u'']
>>> for sp in re.split(u'。|?|!', s):
... print sp
...
我是一句话
你问我要不要被分割
不要啊

>>>

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/138456

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX