-
系统有三个部分 A > B > C
- A 拉多个数据,数据之间有依赖,例如数据 1 会和数据 2 做简单计算,这里用了类似有向无环图的思想,请求异步,速度可以接受,消耗资源当然不大。
- B 对 A 的数据结果做计算,这里计算的不同在于,这些计算模块大多为 pandas 和 sklearn 的操作,其他部门同学封装好的包,B 部分会占用极大的 cpu 资源,而且相当耗时。
- C 类似于 A,需要 B 的结果,然后简单计算。
-
A,B,C 是三个不同的服务(其实 C 在这里不太重要了)。最近请求量增多,今天 B 的其中一台机器扛不住几乎要挂,不过请求分布是有明显高峰期的,低峰就没问什么问题。另外,B 就是一个个的数据处理分别调用,没有其他的复杂逻辑,生产是 nginx+uwsgi+flask 。
-
之前没有接触过这种结构的项目,也没有什么架构经验,所以问题可能比较 easy~