爬虫问题。使用 Chrome 复制得到的 Xpath,抓取到的内容为空

2020-07-27 18:05:18 +08:00
 Frankhong
抓取的网址: https://leetcode-cn.com/problemset/all/?topicSlugs=greedy
response.xpath("//*[@id="question-app"]/div/div[2]/div[2]/div[2]/table/tbody[1]/tr")的结果为空。请教各位大佬,问题出在了哪里呢?
2105 次点击
所在节点    Python
5 条回复
coderunI
2020-07-27 18:36:52 +08:00
css 可以用的 .reactable-data .question-title a
musi
2020-07-27 18:49:07 +08:00
ajax 请求?
nullboy
2020-07-27 18:53:26 +08:00
尽量不用浏览器复制出来的 xpath 。不要那么长,尽量短些。另外尽量不要用 index 去定位。
sheep3
2020-07-27 19:10:02 +08:00
你看看实际 http 返回的数据是什么

view-source:https://leetcode-cn.com/problemset/all/?topicSlugs=greedy

<div class="row" id="question-app"></div>内的数据都是生成的,你需要寻找接口数据来源,F12 看 network 具体找一下
xueyoucai
2020-07-28 09:41:19 +08:00
xpath
不识别 tbody 的 所以在代码中去掉 tbody 就好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/693531

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX