[菜鸟提问] 一个小爬虫的问题!

2015-10-25 21:00:56 +08:00
 musec
目的是爬取 360 某站全部用户名!
我写出了!提取指定 ID 的!怎么循环啊~

# -*- coding:utf-8 -*-
import re
import urllib2
import urlparse

url = '25911'
pj = urlparse.urljoin('http://security.360.cn/User/userInfo/uid/',url)
page = urllib2.urlopen(pj)
html = page.read()
p = re.compile(r'<span\s*class="w100">(.+?)</span>')
print p.findall(html)
1969 次点击
所在节点    Python
2 条回复
nerozhu
2015-10-25 23:09:56 +08:00
试试 BeautifulSoup 吧
master13
2015-10-27 09:14:31 +08:00
并没有看懂问题……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/230995

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX