V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
feather12315
V2EX  ›  问与答

scrapy 运行 24h 后速度变慢

  •  
  •   feather12315 · 2016-04-09 00:44:23 +08:00 · 1347 次点击
    这是一个创建于 3109 天前的主题,其中的信息可能已经有所发展或是发生改变。

    DigitalOcean $5/mon 配置。 scrapy 运行在 docker 容器中。

    DOWNLOAD_DELAY = 1
    LOG_LEVEL = 'INFO'
    

    使用 cookie ,每次传入的 cookie 总是同一个。抓取微博的各种数据。

    这里是使用的代码

    scrapy 连续运行 24H 后(很准时),速度总会变为原来的 1/2 。

    假如是内存不够的话,第一次设置 DELAY=2 , 24h 后速度变为原来 1/2 ;第二次设置 DELAY=1 , 24h 后速度变为原来 1/2 。第三次运行中又开了一个 uwsgi 容器,速度也是 24h 后变为原来的 1/2 。这也太准时了吧!

    假如是 cookies 的原因,设置 24h 后重新登录,速度还是会在 24h 后变为原来的 1/2 。

    这是为啥呢?求老司机帮助

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   938 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 22:15 · PVG 06:15 · LAX 15:15 · JFK 18:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.