最近学习与练习 scrapy 终于会基本的改规则了。(当然只限于下载图片 数据处理那部分还没学)
http://www.jdlingyu.moe/cosplay/page/2/
目标站
内容页已经会采集了。
但是他的链接分页是 相关分页 也就是第一页的时候只显示 23 最后一页。
如何才能写的规则 我改的妹子图的分页规则是 直接抓取(因为妹子图是完整分页)
pages = sel.xpath('//*[@id="pagenavi"]/a/@href').extract()
print('pages: %s' % pages)
if len(pages) > 2:
page_link = pages[-2]
request = scrapy.Request('http://www.jdlingyu.moe/cosplay/page/%s/' % page_link, callback=self.parse)
yield request
请问一下应该怎么写?
感谢 GOD
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.