求助,字符替换

2022-10-19 20:56:02 +08:00
 coolloves
<a href="http://127.0.0.1/<b>test1</b>"><b>test</b></a></br><a href="http://127.0.0.1/<b>test2</b><b>test2</b>"><b>test2</b></a></br><a href="http://127.0.0.1/<b>test3</b><b>test3</b><b>test3</b>">test3</a></br><b>thisistest1</b><b>thisistest2</b>


如上 html 示例代码,想用正则替换掉<a href="http://127.0.0.1/<b>test1</b>"> 这种格式里面的<b>和</b>标签,用 re.sub,总是有点问题,要么删除的不干净,要么过了,把后面标签外的也去掉了.请大家帮忙看看,谢谢了!
1319 次点击
所在节点    Python
3 条回复
r6cb
2022-10-19 22:55:20 +08:00
给个思路:括号匹配
ltux
2022-10-19 23:26:33 +08:00
coolloves
2022-10-20 07:23:59 +08:00
基本算解决了吧,先把 br 换成 /n ,之前正则总是误伤,
这样,非贪婪匹配的时候就不会跨行误伤

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/888218

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX