bugsnail
0.07D
V2EX  ›  外包

有偿找个爬虫工程师爬个数据(非隐私敏感信息/非电商)

  •  
  •   bugsnail · Aug 13, 2024 · 1093 views
    This topic created in 646 days ago, the information mentioned may be changed or developed.

    要求

    熟悉 scrapy+scrapy-redis 组件来实现增量式及分布式爬虫,对目标网站进行大规模爬取后存入 Mysql 数据库;

    实现异步多任务爬取,单次爬取全站,更新周期为月度或者季度

    熟悉处理网站的各种反爬(验证码、代理池等);

    有 3 年以上大量数据的爬取开发经验

    熟悉 xpath 、RE 、str 方法对数据进行抽取与清洗

    熟悉 redis 及 Mysql 数据的存入

    良好的编码能力(代码架构/注释)、良好的学习能力(业务沟通及理解)、分析问题解决问题的能力(突破反爬);

    联系方式

    vx(base64):ODUwNzc5NDk1IA==

    Supplement 1  ·  Aug 19, 2024
    已找到人了
    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3321 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 11:48 · PVG 19:48 · LAX 04:48 · JFK 07:48
    ♥ Do have faith in what you're doing.