Python 中哪个库可以获取一个网页元素的 XPath?

2016-01-14 15:45:30 +08:00
 exploitcat

最近有个需求,就是拿到一个网页的源代码,然后找到其中元素对应的 XPath ,在 Python 中完成。
类似于 Chrome 中的"Copy XPath"功能。
伸手党想问一下有没有现成的 Python 库可以解决?

3533 次点击
所在节点    问与答
8 条回复
leisurelylicht
2016-01-14 15:48:33 +08:00
from lxml import etree

或者

beautifulsoup
exploitcat
2016-01-14 15:59:07 +08:00
@leisurelylicht 有没有 demo 呢? 可以获取指定 element 的 xpath ?
bdbai
2016-01-14 17:56:15 +08:00
楼上说的是通过 XPath 选择元素吧。
为什么要用 Python 生成 XPath ?如何确定是哪一个元素?
imn1
2016-01-14 18:36:29 +08:00
同一元素 xpath 有多种写法
最简单的方法是你自己递归父节点,直到 root 节点
exploitcat
2016-01-14 19:42:58 +08:00
@bdbai 需求往往不需要解释。。。。
leisurelylicht
2016-01-15 09:47:12 +08:00
@exploitcat 好像没有,需要你自己生成
wwxiong
2016-01-15 10:28:32 +08:00
@exploitcat 可以看看 https://github.com/wwxiong/spiders/blob/master/meizi_spider.py 爬虫。里面就是使用 lxml 。
ruiruirui
2019-12-10 13:53:08 +08:00
楼主是如何解决这个问题的,我现在也有个这么一个需求。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/250737

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX