V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
php01
V2EX  ›  程序员

谁爬过谷歌文化学院的高清图片?个把月了,没摸到边还,求指点指点。

  •  
  •   php01 · 2017-11-27 09:46:58 +08:00 · 3893 次点击
    这是一个创建于 2313 天前的主题,其中的信息可能已经有所发展或是发生改变。
    13 条回复    2017-11-29 08:17:18 +08:00
    php01
        3
    php01  
    OP
       2017-11-27 10:47:23 +08:00
    @artandlol 他的图片都可以放很大,然后慢慢变得更加清晰,甚至能够看清楚纸张纹路,缩放比例最高到 100,然后等一会就会变得很清晰,你能教我找到最终的最清晰的原图地址吗
    php01
        4
    php01  
    OP
       2017-11-27 10:48:55 +08:00
    @artandlol https://www.google.com/culturalinstitute/beta/asset/lot-and-his-daughters-reverse/wwFqKA-OQi03wg?hl=zh-CN 例如这张,每放大一次就会变得更清晰。怎么找到最清晰的图压?
    Pinwheel
        6
    Pinwheel  
       2017-11-27 11:16:42 +08:00   ❤️ 1
    @php01 这一张图缩略图地址是 http://lh3.ggpht.com/NpZ4ve9FtSSNz7BdpIWu8jaOUM4SLUDiLawc1Ybn_og0hKTdMj0BN-WPups

    让它稍微清晰一点可以在后面加上=s1200,也就是 http://lh3.ggpht.com/NpZ4ve9FtSSNz7BdpIWu8jaOUM4SLUDiLawc1Ybn_og0hKTdMj0BN-WPups=s1200

    对于这张图,它最清晰的版本是由多张图片拼接而成的,也就是楼上说的那种加了 blob 的链接
    anmaz
        7
    anmaz  
       2017-11-27 11:25:35 +08:00 via Android   ❤️ 1
    拼接的,还是调分辨率截屏直接上手比较好
    demov2
        8
    demov2  
       2017-11-27 11:34:06 +08:00   ❤️ 1
    @artandlol
    目测不是人工裁剪,记得 Google 出个一个应用用来拍摄老照片的,所以这个技术应该还是有的吧。

    https://sspai.com/post/36172
    php01
        9
    php01  
    OP
       2017-11-27 12:06:37 +08:00
    @Pinwheel 那是不是说要做这个爬虫爬到最清晰的照片没有办法或者要爬到会很麻烦压
    Pinwheel
        10
    Pinwheel  
       2017-11-27 12:58:33 +08:00
    @php01 是的,你可以看一下,发出了多个请求,每个请求收到的图片都是一幅大图的一部分。
    artandlol
        11
    artandlol  
       2017-11-27 13:34:39 +08:00   ❤️ 1
    js 简单版,拿好,可以结合 casperjs 使用
    ==========
    Array.prototype.uniquestr = function(){
    var res = [];
    var json = {};
    for(var i = 0; i < this.length; i++){
    if(!json[this[i]]){
    res.push(this[i]);
    json[this[i]] = 1;
    }
    }
    return res;
    }
    var reg = /\w+.(googleusercontent.com|ggpht.com)\/(\w|[-])+/g;
    var html = document.documentElement.innerHTML;
    var para = "=s1200";
    var htmlele = html.match(reg);
    function unique(a) {return Array.from(new Set(a));}
    var uniqele = unique(htmlele);
    var newuniqele = uniqele.uniquestr();
    for(var i = 0;i < newuniqele.length; i++) {
    console.log(newuniqele[i]+para+"\n");
    }
    php01
        12
    php01  
    OP
       2017-11-27 13:43:24 +08:00
    @artandlol 求写个最清晰版,手动可怜,手动 555555
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1003 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:05 · PVG 06:05 · LAX 15:05 · JFK 18:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.