我最近初学python和正则表达式,想写一个简单的爬图片的网络爬虫程序。但是现在卡在怎么分析图片地址上面。具体我有以下两个问题,想请教下大家: 1、比如http://lumeizhi.com这个网站,我用chrome浏览,按f12,怎么快速准确找到图片地址? 2、怎样写相应的正则表达式呢? 我写的代码是这样的: import urllib2 import urllib import re
pat = re.compile('') html = urllib2.urlopen('http://lumeizhi.com').read() imglist = pat.findall(html) i = 1 for x in imglist: urllib.urlretrieve(x,'D:\pic\%s.jpg' % i) i = i + 1
pat = re.compile('<img src="(.*?)"') html = urllib2.urlopen('http://lumeizhi.com').read() imglist = pat.findall(html) i = 1 for x in imglist: url = 'http://lumeizhi.com' + x urllib.urlretrieve(url, 'D:\pic\%s.jpg' % i) i = i + 1