loveuloveme
V2EX  ›  PHP

PHP 蜘蛛判断,这个函数应该蛮 OK 的,不会有浏览器被误判吧

  •  
  •   loveuloveme · Nov 17, 2020 · 3211 views
    This topic created in 2020 days ago, the information mentioned may be changed or developed.
    function is_bot()
    {
        return isset($_SERVER['HTTP_USER_AGENT']) &&
                   preg_match('/bot|crawl|slurp|spider|mediapartners/i',  $_SERVER['HTTP_USER_AGENT']);
    }
    
    4 replies    2020-11-17 12:09:34 +08:00
    maskerTUI
        1
    maskerTUI  
       Nov 17, 2020
    意义不大,ua 是可以伪造的,正常情况下爬虫都会伪装成浏览器。
    loveuloveme
        2
    loveuloveme  
    OP
       Nov 17, 2020
    @maskerTUI 不会有浏览器被误判就行了,伪造的不用管
    sadfQED2
        3
    sadfQED2  
       Nov 17, 2020 via Android
    意义不大+1

    你这个只能拦住正规爬虫,拦正规爬虫可以直接写 robot.txt
    westoy
        4
    westoy  
       Nov 17, 2020
    看你打算干什么了

    几大搜索引擎都会用非标识的 IP 段和 UA 检测网站, 判断爬虫 UA 针对性吐数据 SEO 可能会被降权的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2643 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 12:23 · PVG 20:23 · LAX 05:23 · JFK 08:23
    ♥ Do have faith in what you're doing.