V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sun1993
V2EX  ›  问与答

现在爬虫技术中如果遇到需要登录才能访问的接口,都是如何处理的?

  •  
  •   sun1993 · 2022-11-18 11:13:58 +08:00 · 527 次点击
    这是一个创建于 497 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,比如 web 端,有些需要登录才能访问的资源,我能想到的访问方式就是将用户的 Cookie 全部写入请求头,而 Cookie 又需要用户自己登录才能获得,如果登录允许无限重试,密码可以用穷举法破解掉,但现在一般网站重试次数有限,而且大都配备了先进的验证码,这个方式就基本上废掉了,移动端也是类似的局面,那么现在的爬虫技术如何破解这种局面呢?

    Eiden
        1
    Eiden  
       2022-11-18 11:19:31 +08:00
    这不是盗号吗
    wellCh4n
        2
    wellCh4n  
       2022-11-18 13:29:14 +08:00
    需要登录 => 注册一个号
    字母验证码 => OCR
    滑块验证码=> 机器视觉 + selenium
    更先进验证码 => 打码平台

    穷举破解密码可刑,不可取
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4287 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 05:30 · PVG 13:30 · LAX 22:30 · JFK 01:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.