这个产品图片怎么爬下来?

2018-12-26 08:10:59 +08:00
 fan2006
如: https://mall.icbc.com.cn/products/pd_0001381554.jhtml 这个产品左边的 5 个大图。得到图片的链接用浏览器试总会跳转到主页去了。不知道怎么处理?希望能指点一下。
4612 次点击
所在节点    Python
25 条回复
celeron533
2018-12-26 12:21:48 +08:00
https://image5.mall.icbc.com.cn/image/10023640/4/1524359627669_3.jpg

直接 F12,禁用缓存,抓取网络请求。重新刷新页面就能得到地址。
fan2006
2018-12-26 14:01:55 +08:00
@celeron533 正解。这个是对的。感谢大佬
lanqing
2018-12-26 15:20:54 +08:00
加 referer 就可以了
qooder
2018-12-26 16:45:12 +08:00
想知道为什么会跳转。。。
15399905591
2018-12-26 17:03:23 +08:00
应该是加了防盗链限制,只允许来源 mall.icbc.com.cn 域名的地址访问,你把在 header 中添加一个 referer 属性,标识来源的是该域名就可以了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/521010

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX