V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
joker2026
V2EX  ›  外包

求爬虫脚本

  •  
  •   joker2026 · 2023-10-08 09:47:53 +08:00 · 958 次点击
    这是一个创建于 412 天前的主题,其中的信息可能已经有所发展或是发生改变。

    爬虫地址: https://www.mouser.cn/c/semiconductors/memory-ics/eeprom/ 优点:典型的表格,翻页获取下一页,点击进去详情获取数据 难点:站点采用了反爬虫机制,抓两页之后就会出发 human verfiy

    要求:给出 python 脚本,抓取指定地址的所有产品的详情数据

    联系微信:martin20020312

    9 条回复    2023-10-11 20:41:20 +08:00
    aino
        1
    aino  
       2023-10-08 11:37:36 +08:00
    这个站点用的 akamai 防护,你的预算多少
    aino
        2
    aino  
       2023-10-08 11:38:31 +08:00
    perimeterx+akamai
    sr0miao
        3
    sr0miao  
       2023-10-08 14:33:46 +08:00
    早些年搞过这些电子元件贸易网站,那时候竞品网站之间的竞争就很激烈了
    linpm
        4
    linpm  
       2023-10-08 15:48:43 +08:00 via iPhone
    麻烦你重新留个联系,添加频繁
    gfswoquasfasd
        5
    gfswoquasfasd  
       2023-10-08 16:08:30 +08:00
    很刑
    owltacklejaguar
        6
    owltacklejaguar  
       2023-10-08 16:17:05 +08:00
    这里不是有下载表格
    ysb255236295
        7
    ysb255236295  
       2023-10-09 11:22:45 +08:00
    搞这个能干嘛
    yagamil
        8
    yagamil  
       2023-10-10 00:42:36 +08:00
    @aino 阿卡迈貌似没个几万块搞不下来。
    linpm
        9
    linpm  
       2023-10-11 20:41:20 +08:00 via iPhone
    这是个白嫖的,二次转包一千多块就想爬下来
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   969 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 20:17 · PVG 04:17 · LAX 12:17 · JFK 15:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.