Python 新手寻求帮助-如何在 Python 中使用 beautifulsoup 获取 onclick 的信息?

2018-07-27 00:53:54 +08:00
 zhcq163

大神们好,我已经将某页面进行格式化处理,将所需要的内容格式化成<a href="javascript:void(0)" onclick="showInfo('XXXXXXXXXXXXXXX'),但是我想获取到 onclick 内的所有 XXXXXXXXXXXX 的字符串信息,这个应该怎么操作,谢谢

2846 次点击
所在节点    Python
6 条回复
Sylv
2018-07-27 01:02:53 +08:00
KeatingSmith
2018-07-27 08:36:38 +08:00
re.findall(r ’<a.*?onclick=“ showInfo\(\’(.*?)\’\).*?>’, text)
yanzixuan
2018-07-27 11:00:52 +08:00
soup.find('a').attrs.get("onclick", "")
ddzzhen
2018-07-27 12:45:48 +08:00
正则即可
zhcq163
2018-07-27 13:43:16 +08:00
@ddzzhen 正则应该怎么写
glaucus
2018-07-27 16:11:01 +08:00
@zhcq163 二楼就是给你写的正则呀,而且这个用 substring 也可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/474529

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX