shaojz2005
V2EX  ›  问与答

测试网站不小心被百度收录了,通过 useragent 判断并返回 403 有效吗?

  •  
  •   shaojz2005 · Aug 20, 2019 · 1326 views
    This topic created in 2475 days ago, the information mentioned may be changed or developed.

    测试网站不小心被百度收录了,而且有时候比正式网站的权重更高,无语了。

    但是测试网站还要用,不方便关掉。网上看到有个在 nginx 配置里,根据 useragent 来返回 403 的方法:

    if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot") { return 403; }

    不知道百度这些搜索引擎会不会伪造 useragent 来绕过限制进行收录呢?

    3 replies    2019-08-21 23:28:02 +08:00
    learningman
        1
    learningman  
       Aug 20, 2019 via Android
    建议试试 robots.txt
    shaojz2005
        2
    shaojz2005  
    OP
       Aug 20, 2019
    @learningman 不能阻止收录首页
    googlefans
        3
    googlefans  
       Aug 21, 2019
    将测试域名做 301 转向正式网站域名
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2644 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 12:23 · PVG 20:23 · LAX 05:23 · JFK 08:23
    ♥ Do have faith in what you're doing.