DigitalOcean $5/mon 配置。 scrapy 运行在 docker 容器中。
DOWNLOAD_DELAY = 1
LOG_LEVEL = 'INFO'
使用 cookie ,每次传入的 cookie 总是同一个。抓取微博的各种数据。
scrapy 连续运行 24H 后(很准时),速度总会变为原来的 1/2 。
假如是内存不够的话,第一次设置 DELAY=2 , 24h 后速度变为原来 1/2 ;第二次设置 DELAY=1 , 24h 后速度变为原来 1/2 。第三次运行中又开了一个 uwsgi 容器,速度也是 24h 后变为原来的 1/2 。这也太准时了吧!
假如是 cookies 的原因,设置 24h 后重新登录,速度还是会在 24h 后变为原来的 1/2 。
这是为啥呢?求老司机帮助