诸位大牛 我刚刚学python遇到个百思不得其解的问题,我想爬豆瓣的一些图片,并下载到e:/tu 目录中,用的 re, urllib 两个库,程序我认真检查就是不知道问题出在哪, 太毁信心了,能否帮我看下?拜谢!
ps: 程序能够打印出所有图片的地址,问题应是在下载那,我应该如何修改呢?
#coding = utf-8
import re
import urllib
orin_html= urllib.urlopen("
http://www.douban.com/photos/album/138010643/?start=0").read()
imgreg = re.compile(r'img.\..*jpg')
imglist = re.findall(imgreg,orin_html)
'''
需要说明的是,一直到这里都没有问题, 能够打印每张图片的链接
'''
x = 0
for i in imglist:
urllib.urlretrieve(i,'e:/tu/%s.jpg' % x)
x = x + 1
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/194501
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.