正则表达式怎么提取表达式中需要的东西

2017-03-08 01:40:11 +08:00

HFX3389

就是一段类似这样的字符。

2NB 厉害文本 3SD 速度文本 4UPDATE_TIME 更新时间文本

前面第一到两位是数字，有些是 11 、 12 之类的

中间是英文，有时携带符号

后面是中文，但并不需要“文本”这个字符串

需要的结果是中间的英文和后面的中文。

为“ NB ”，“厉害”，“ SD ”，“速度”，“ UPDATE_TIME ”，“更新时间”这样一个匹配的字符串

在使用 Python3 的正则表达式的时候，能不能选择类似

[1-9]\d??[A-Z]+?[\u4e00-\u9fa5]+

(这个没有匹配“ UPDATE_TIME ”)

这一堆中只要

“[A-Z]+?”

和

“[\u4e00-\u9fa5]+”

所匹配出来的字符串

1286 次点击

所在节点

问与答

5 条回复

DiamondbacK

2017-03-08 07:16:47 +08:00

不会 Python ，刚刚 google 查文档凑出来的：

```python
in: origStr = "2NB 厉害文本 3SD 速度文本 4UPDATE_TIME 更新时间文本"

In: list(filter(lambda x: x != '文本', re.findall('[^ \d]+', origStr)))
out: ['NB', '厉害', 'SD', '速度', 'UPDATE_TIME', '更新时间']
```

ref:
https://docs.python.org/2/library/re.html
http://book.pythontips.com/en/latest/map_filter.html