最近在写公众号爬虫 图片地址爬下来了,想直接转载显示,但是会被 block http://productchaseapp.herokuapp.com/misc/tjhot
但是,像传送门,就没有这个问题... 比如 http://chuansong.me/n/341346651316
不知道是为啥?求各位前辈指点....
图片链接都是使用的http://read.html5.qq.com/
做的前缀,不知道为什么会表现不同?
1
wuhx 2016-05-20 18:57:08 +08:00
你的 refere 被拒绝了, 测试了一下,有些域名没问题,有些就不行,不知道是什么算法
你的域名换成 https 也 ok ,直接开 https 吧 测试结果看 size , 44820 字节是正常, 8196 是拒绝图片 wuhx@gynoid:λ curl --referer "http://productchaseapp.herokuapp.com/misc/tjhot" -Lo "b.jpeg" "http://read.html5.qq.com/image?src=forum&q=5&r=0&imgflag=7&imageUrl=http://mmbiz.qpic.cn/mmbiz/4SzSI83cwBUnBJoBy4Hjp2cYfdE6uBJHicw0d4178n3nvDjx6syBZYBEZLOuPxd75sJpLk3ib5ngXA8334UDUhvA/0?wx_fmt=jpeg" % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 8196 100 8196 0 0 9180 0 --:--:-- --:--:-- --:--:-- 9178 wuhx@gynoid:λ curl --referer "https://productchaseapp.herokuapp.com/misc/tjhot" -Lo "b.jpeg" "http://read.html5.qq.com/image?src=forum&q=5&r=0&imgflag=7&imageUrl=http://mmbiz.qpic.cn/mmbiz/4SzSI83cwBUnBJoBy4Hjp2cYfdE6uBJHicw0d4178n3nvDjx6syBZYBEZLOuPxd75sJpLk3ib5ngXA8334UDUhvA/0?wx_fmt=jpeg" % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 44820 100 44820 0 0 63717 0 --:--:-- --:--:-- --:--:-- 63664 wuhx@gynoid:λ curl --referer "http://xun.im/" -Lo "b.jpeg" "http://read.html5.qq.com/image?src=forum&q=5&r=0&imgflag=7&imageUrl=http://mmbiz.qpic.cn/mmbiz/4SzSI83cwBUnBJoBy4Hjp2cYfdE6uBJHicw0d4178n3nvDjx6syBZYBEZLOuPxd75sJpLk3ib5ngXA8334UDUhvA/0?wx_fmt=jpeg" % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 44820 100 44820 0 0 27698 0 0:00:01 0:00:01 --:--:-- 27700 |