V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
glp664186796
V2EX  ›  问与答

可以用 selenium 获取一个亚马逊店铺里所有产品的详细信息吗?

  •  
  •   glp664186796 · 2020-04-02 15:49:54 +08:00 · 950 次点击
    这是一个创建于 1485 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景: 我们公司是做跨境电商亚马逊的,五个账号,每个账号都在德法意西四个站点开了店铺,有很多产品。我的工作是要搜集各个店铺里合适的产品,把相关信息做成表格,然后发给不同的国家的测评中介。之前都是手动复制粘贴,都是机械劳动。我会使用 Python 和 selenium,所以有个想法,问问大家能不能行。

    想法: 用脚本通过店铺的链接进入店铺产品列表页面,点击第一个产品进入详情页,然后从页面获取到标题、价格、asin 等信息,存在 Excel 或者 MySQL 里面。

    疑虑: 1.听说亚马逊反爬虫机制很厉害,这个算是爬虫吗?对脚本运行效率没有要求,可以每一步之间强制停一秒。 2.如果能实现的话,只要亚马逊不更改页面布局,后面就不用再维护了吧。

    3 条回复    2020-04-03 18:57:47 +08:00
    127000
        1
    127000  
       2020-04-02 16:33:40 +08:00
    glp664186796
        2
    glp664186796  
    OP
       2020-04-03 18:40:20 +08:00   ❤️ 1
    @127000 我今天试了试,自动点下一页的时候,浏览器提示“firefox 正在防御社交网站对您的追踪”。看了下记录,之前的追踪数是 0,只有今天有追踪。这是不是亚马逊的防御机制,可能会封我的 ip ?
    127000
        3
    127000  
       2020-04-03 18:57:47 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5442 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 08:54 · PVG 16:54 · LAX 01:54 · JFK 04:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.