首先 你用了 3 家云平台,简单可以理解为 3 个网络区域,当然如果你在云服务商那边机器分散在多个机房节点,也必然超过 3 个网络区域了
这里以 3 个网络区域,给你建议:
国内外生产机器集群管理,包括 facebook,google...等目前大部分都在使用 saltstack 或者 ansible ,这类工具有编排的功能,可以以应用维度,编排配置模版,标准化管理 ; 这块废弃了大部分运维工程师的脚本管理,极大的提高了管理效率
3 个网络区域,那么就需要在每个网络区域,部署一台 salt-master 节点机器,该机器负责统一管控 该网络区域下面的节点机器
同时 你需要确保人员登录生产机器的权限管理,那么 3 个网络区域,每个区域至少出一台带公网的机器,作为该区域的 login 入口机器; 流程就是本地先登录到 login 机器, 再从 login 机器 ssh 生产业务机器的内网 IP ,登录到业务机器
3 个网络区域,3 个 salt-master 3 个 login 机器,统一通过 一台 central 总控机器 调度管理,实现异地多机房统一管控
最简单的例子:
某员工申请 A 节点的某应用机器权限, 那么他通过 central web 平台提交权限申请, 管理人员审批通过后, central 判断 这是 A 节点的机器,调度 A 的 master 下方 创建该员工的账号权限,同时记录过期时间,到期提醒,回收
其他的部署发布流程,都是类似的处理
安全问题嘛:
1. 多重维度确保 内网机器的登录 源只有 2 个,节点 login 机器和节点 master 机器
2. login 机器的权限管理方式是,默认只有普通权限,而且禁止密码方式登录,只能通过 RSA 可信认证登录
等等,其他细节问题,暂不提
部署问题嘛:
1. 基础环境部署
2. 应用包部署
均可通过 编写 sls 模版,完成; 然后 在平台 一键化 部署,内部会自动拆单处理
等等等等,详细请看
http://community.xabcloud.com/topic/20/企业一体化 ops 平台功能介绍