有个需求是,把其他好几个个网站的数据爬取出来(有些网站也直接用 api 读取到数据),然后,在自己的服务器把这些问题整合起来,在开放接口给用户调用。
现在的问题是:
可以把 web 接口(开放给我们客户使用的)和定时爬取数据的定时任务放在一个单独的应用进行部署。也可以把定时爬取任务和 web 接口(开放给我们客户使用的)分开单独部署。这两种方式那种更合适,都有什么优缺点?
一边用定时任务去爬取数据,然后,写入数据库。另外用户可能也正在读取数据库的同一张表的数据。这样会影响到读取数据的速度吗?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.