[菜鸟提问] 一个小爬虫的问题！

2015-10-25 21:00:56 +08:00

musec

目的是爬取 360 某站全部用户名！
我写出了！提取指定 ID 的！怎么循环啊~

# -*- coding:utf-8 -*-
import re
import urllib2
import urlparse

url = '25911'
pj = urlparse.urljoin('http://security.360.cn/User/userInfo/uid/',url)
page = urllib2.urlopen(pj)
html = page.read()
p = re.compile(r'<span\s*class="w100">(.+?)</span>')
print p.findall(html)

1997 次点击

所在节点

Python

2 条回复

nerozhu

2015-10-25 23:09:56 +08:00

试试 BeautifulSoup 吧

master13

2015-10-27 09:14:31 +08:00

并没有看懂问题……

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/230995

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.