如何使用pyquery获得一个页面的所有链接?

2013-01-31 16:45:40 +08:00
 shanshuise
# -*- coding:utf-8 -*-
from pyquery import PyQuery as pq

d = pq(url='http://hi.baidu.com/tombkeeper/')
d.make_links_absolute()
lasers = d('.a-title')

获取class为a-title的内容后,如果直接.attr('href')只能返回第一个链接,怎么才能返回里面的全部链接呢?
4637 次点击
所在节点    Python
4 条回复
lijie0427
2013-01-31 19:43:23 +08:00
for url in lasers:
print url.attrib['href']
shanshuise
2013-01-31 19:52:07 +08:00
@lijie0427 多谢,已经可以返回全部的链接了。

请问attrib['href']这一个写法在哪里有相应的介绍吗?我想看一看。
lijie0427
2013-01-31 20:36:29 +08:00
@shanshuise
pyquery底层调用的是lxml库。
http://lxml.de/api/index.html
你看那个lxml.html.HtmlElement
zz
2013-01-31 20:40:27 +08:00
才知道有这个库,一直都是用lxml

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/59391

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX