正则表达式 关于“非”的问题请教

2019-11-06 16:44:14 +08:00
 faketemp

测试文本:helloItsmeaabbhereddeeend

使用正则“(\w)\1(\w)\2”可以轻易提取“aabb、ddee”这种指定类型的叠词出来

问题:
想删除除了“(\w)\1(\w)\2”匹配值以外的任意字符(包括换行符等),正则应如何修改?

注意: 以上只是举例子,目的不是要提取叠字,只是想学习一下“非 xxx”的正则表达

1235 次点击
所在节点    问与答
6 条回复
mainjzb
2019-11-06 17:26:11 +08:00
(?!(\w)\1(\w)\2)(\w\w\w\w)
ClericPy
2019-11-06 17:30:58 +08:00
想学习就看看零宽断言吧
前后缀都有 非 的用法

以前回答过, 直接复制过来看看效果, python


import re

# 都存在
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如中文不'))
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '英语不如不'))
print(re.search(r'^(?=.*中文)(?=.*英语).*$', '不如不'))
# <re.Match object; span=(0, 7), match='英语不如中文不'>
# None
# None
# 都不存在
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如中文不'))
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '英语不如不'))
print(re.search(r'^(?!.*中文)(?!.*英语).*$', '不如不'))
# None
# None
# <re.Match object; span=(0, 3), match='不如不'>
faketemp
2019-11-07 08:56:02 +08:00
@mainjzb 这样表达是不正确的哦
(?!(\w)\1(\w)\2)(\w\w\w\w)会得出六组匹配结果
hell、oIts、meaa、bbhe、redd、eeen

可以看到既没有跳过 aabb、ddee 叠字,又没有匹配到最后一个字母 d
faketemp
2019-11-07 08:58:46 +08:00
@ClericPy 零宽断言基本用法我会
你写的两断代码 分别为“包含”、“不包含”也能懂

但是就还是想不出上面那个问题 怎么描述和表达
烦请指教
faketemp
2019-11-07 09:02:20 +08:00
@ClericPy

这个练习的要求就是
测试文本:helloItsmeaabbhereddeeend
结果:aabbddee

要求不是用正则直接提取 aabbddee,而是要用正则去删除除了四字叠词以外的其他所有字符
faketemp
2019-11-09 10:47:52 +08:00
是否有 V 友关注指教下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/616904

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX