关于用 Scrapy 框架开发爬虫时保存图片操作的咨询

2017-10-19 22:34:46 +08:00
 saximi
用 Scrapy 框架开发爬虫,按照一般的规范,对图片进行下载并保存的操作是不是应当放在 pipelines.py 中实现呢?
谢谢
2313 次点击
所在节点    Python
7 条回复
misaka19000
2017-10-19 22:46:28 +08:00
是的
saximi
2017-10-19 23:33:00 +08:00
@misaka19000 谢谢!
sunwei0325
2017-10-20 12:58:27 +08:00
saximi
2017-10-20 22:11:39 +08:00
@misaka19000 爬虫下载图片的做法,是不是最好用的还是 urllib 模块和以下的步骤?
req=urllib.request.Request(imageURL)
response=urllib.request.urlopen(req)
data=response.read()
saximi
2017-10-20 22:18:27 +08:00
@sunwei0325 谢谢,我去学习学习
saximi
2017-10-24 20:19:51 +08:00
@sunwei0325 请教,这个例子中的 get_media_requests(self,item,info)方法,info 参数是怎么个用法呢?谢谢
sunwei0325
2017-10-25 06:34:42 +08:00
@saximi 没什么用, 兼容旧版本的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/399071

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX