scrapy 的 xpath 测试 有没有什么所见即所得的方式?

2016-07-28 11:24:37 +08:00
 xiaoyu9527

我用 chrome 的 console 来测试 即便测试成功。 在 scrapy 里 也会抓不到数据。

有没有办法所见即所得呀。

1629 次点击
所在节点    问与答
8 条回复
laoyur
2016-07-28 12:43:20 +08:00
xiaoyu9527
2016-07-28 15:54:50 +08:00
感觉现在所见即所得的 XPATH 抓取工具还真的不少。

今晚回家好好研究研究

gooseeker 就是一个。

得认真做一个数据抓取者了(辣鸡制造者)了
imn1
2016-07-28 16:05:29 +08:00
除了上面说的 firebug+firepath ,可视化右键指哪选哪的还有
WebDriver Element Locator 这个可以右键输出 C# Ruby Python Java Xpath 几种语言的 locator
https://addons.mozilla.org/en-US/firefox/addon/element-locator-for-webdriv
Yet Another Remove It Permanently 这个主要是隐藏页面元素用的,但有个 copy xpath/css 的功能
https://addons.mozilla.org/en-US/firefox/addon/yarip
xiaoyu9527
2016-07-28 16:19:41 +08:00
@imn1 我用 chrome 取出来的在 scrapy 经常不能用。。
laoyur
2016-07-29 09:40:28 +08:00
@xiaoyu9527 确定不是因为 chrome 取的元素是 js 渲染出来的?
xiaoyu9527
2016-07-29 10:56:55 +08:00
@laoyur 不太清楚。目前找了一个专门写规则的插件 gooseeker 感觉挺不错的。

可以组合到任何采集器里。

这样可以解决 XPATH 不熟练的大问题
regent
2017-08-20 11:05:55 +08:00
@xiaoyu9527 请问后面您找了一个什么插件解决问题?谢谢
xiaoyu9527
2017-08-21 14:21:47 +08:00
@regent 我不是已经说了么。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/295470

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX