V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
aaa0009
V2EX  ›  问与答

假设我自己有个 ip,是否可以通过某种手段,让 php gethostbyaddr 返回百度蜘蛛域名,比如 baiduspider-180-76-15-153.crawl.baidu.com

  •  1
     
  •   aaa0009 · 2016-08-09 14:58:14 +08:00 · 1811 次点击
    这是一个创建于 2823 天前的主题,其中的信息可能已经有所发展或是发生改变。
    8 条回复    2016-08-10 09:34:38 +08:00
    msg7086
        1
    msg7086  
       2016-08-09 15:36:00 +08:00 via Android   ❤️ 1
    可以的。
    aaa0009
        2
    aaa0009  
    OP
       2016-08-09 16:01:46 +08:00
    @msg7086 怎么弄?
    lazycat
        3
    lazycat  
       2016-08-09 17:43:16 +08:00
    RDNS
    ZE3kr
        4
    ZE3kr  
       2016-08-09 21:17:10 +08:00 via iPhone
    有一个 IP 不一定能随便设置 rdns ,一般的,只有当那个域名解析到了那个 IP 才能设置。就算设置上了,一般 gethost 还会再验证一下域名有没有解析到你这个 IP 才行。
    aaa0009
        5
    aaa0009  
    OP
       2016-08-09 21:23:36 +08:00
    @ZE3kr 谢谢。那这么说,如果我要判定 ip 是否是合法的 robots ,比如 google , baidu 的,只要通过 ip ,得到 googlebot.comcrawl.baidu.com 就可以了吗? Baidu 的文档认为这样就可以了,但是 google 的任务需要再通过 hostname 得到 ip 匹配才可以。
    ZE3kr
        6
    ZE3kr  
       2016-08-09 21:27:49 +08:00 via iPhone
    @aaa0009 dig -x [ip] 查出来的是 IP 对应的域名,和 gethost 一样,但实际上可能是随便设置甚至恶意设置的,所以最好再通过域名正向查询一下解析到的 IP 地址,但这样会增加延迟。一般的做法是:如果从域名解析到的 IP 如果不是那个 IP ,直接屏蔽掉。
    msg7086
        7
    msg7086  
       2016-08-09 21:41:58 +08:00
    @aaa0009
    如果 IP 是你自己的,你可以自己设置反向 DNS 。
    aaa0009
        8
    aaa0009  
    OP
       2016-08-10 09:34:38 +08:00
    @ZE3kr 哟,如果这样的话,那么百度的 robots 不就是无法验证了?比如百度 180.76.15.159 得到 baiduspider-180-76-15-159.crawl.baidu.com ,但是 baiduspider-180-76-15-159.crawl.baidu.com 却得不到相应 IP 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2246 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:43 · PVG 13:43 · LAX 22:43 · JFK 01:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.