正则表达式如何匹配链接内的文本

2014-01-13 15:54:20 +08:00
 older
<a href="ss.html">xxxx</a>

如何找到xxxx
3140 次点击
所在节点    问与答
9 条回复
34D
2014-01-13 16:12:44 +08:00
‘<a href="ss.html">(.*?)</a>’
xinhugo
2014-01-13 16:13:58 +08:00
因为不知道你要求的「xxxx」是什么内容,暂且理解为字母或数字或下划线或汉字。

那么,正则表达式则为:<a href="ss.html">\w+</a>

你可以在 http://tool.chinaz.com/regex/ 测试正则表达式。
shiny
2014-01-13 16:14:41 +08:00
为什么一定要正则呢,不能用 dom 解析吗?
older
2014-01-13 16:15:22 +08:00
<a href="这里不确定的">xxxx</a>
@34D
@xinhugo
xinhugo
2014-01-13 16:20:07 +08:00
@older 如果你还有其他的匹配要求,请先给「感谢」,这是基本礼仪。
strak47
2014-01-13 17:01:10 +08:00
<a href=".+\.html">\w*<\/a>
123123
2014-01-13 17:10:50 +08:00
看见一楼回复乐了,简单暴力
xinhugo
2014-01-13 17:22:16 +08:00
1.要求:
1)匹配 <a href="ss.html">xxxx</a> 中的 xxxx。
2)需要匹配的字符,为4个。其中包括字母或数字或下划线,但不包括中文。

结果:<a href="ss.html">\w{4}</a>



2.要求:
1)匹配 <a href="ss.html">xxxx</a> 中的 ss
2)需要匹配的字符,为1个或更多。其中包括字母或数字或下划线,但不包括中文。

结果:<a href="\w+.html">xxxx</a>


3.要求:
1)匹配 <a href="ss.html">xxxx</a> 中的 ss
2)需要匹配的字符,为1个或更多。其中包括字母或数字或下划线或中文。

结果:<a href=".+.html">xxxx</a>
34D
2014-01-14 17:19:40 +08:00
@older 不确定去掉就好了。"<a href=\"(?:.*?)\">(.*?)</a>"

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/96818

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX