scrapy 中使用 Selector 的 xpath 表达式如何选择具有相同 html 标签的元素的内容

2014-09-26 21:37:39 +08:00
 wuming
如: http://emall.chblt.com/Product/ProductDetail.aspx?itemcode=6627200055

我想获得该页面产品简介的内容,但是产品简介所嵌套的div标签并没有任何的id或者class,它的平级还有好几个并列的div,请问xpath表达式是否可以在有几个相同标签的情况下获取到第N个标签元素的写法?或者这个问题是否还有其他方法可以解决。谢谢?
4457 次点击
所在节点    问与答
4 条回复
wuming
2014-09-26 22:52:19 +08:00
目前采用的方法是获取所有相同的标签然后遍历,有更简单的方法么
ZzFoo
2014-09-27 10:11:31 +08:00
Xpath取到的是节点列表,也就说是个list,直接用下标取就行了,比如如果是第三个就是div[2]
Battle
2014-09-27 10:40:43 +08:00
@ZzFoo 如果有些内容要有些不要呢?我爬下来会两行空白一行文字这样子循环
ZzFoo
2014-09-27 16:25:55 +08:00
@Battle 用string类自带的方法strip()

>>> ' \n \nabc'.strip()
'abc'

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/135918

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX