[云计算] 沿用老路 or 破釜沉舟|泰康保险的「三朵云」实现之路

2017-06-06 00:35:42 +08:00
 chousb

互联网对于任何行业来说,都是机遇与挑战并存,对泰康保险而言,更是这样。

是继续沿用成熟的技术老路,还是破釜沉舟,选用新的技术、新的平台,以一场技术变革来支撑成就泰康保险业务在互联网时代的高速发展?

本文中泰康保险数据中心基础设施经理萧军,将会从技术角度来分享泰康保险集团的云端实践。

泰康面临的痛点与挑战

曾经泰康认为云计算就等于虚拟化,所以非常把所有设备向虚拟化平台迁移,也取得了很好的效果,包括设备提供时间、系统扩展等能力都有很大的提升。但当泰康迈向移动互联网的时候,发现传统架构的虚拟化并不能完全满足需求,泰康在广泛的调研和严格的技术认证后,确定了采用云计算平台这一思路。

那么为什么要建设私有云呢?主要有以下五点原因:

第一,国家安全的要求。泰康保险作为金融机构,首先必须合规,另外国家保监会对于泰康也会有一些技术是否自主可控等方面的要求,这些都决定了我们不能像其它非金融企业一样采用将所有的业务搬到公有云。

第二,时效性的挑战。泰康作为全国首家实现全程网上投保的保险公司,用“互联网+”的发展战略不断地敦促自身前进。这个过程中,一周将近推出 30 多种产品,整个产品的研发、上线周期非常短,因此对于 IT 资源的响应速度提出了很高的要求。

第三,业务量的挑战。每周 30 余个产品,带来的用户量非常大,这个对于 IT 基础架构的扩容、并发、可靠性等方面提出了要 求。而且,互联网业务最大的特点就是不确定性,原有的基础设施不具备弹性,没有办法随着业务的变化,对 IT 资源进行伸缩。

第四,生态的挑战。比如即时通信,泰康的业务系统现在经常与微信、微信支付、途牛网站、美团网等其它的第三方接口进行对接。这对于传统的 IT 基础架构来说,没有办法实现。所以我们只能往前走,选择云平台的方式来满足业务部门的需求。

第五,成本的挑战。大量的新产品、订单、合作等等,给 IT 系统的扩容与运维人员带来了很大的挑战。传统 IT 架构下,首先没有办法直接扩容,只能不断的购买新的设备,比如存储柜;其次,每个产品都需要一个专业的运维人员去管理设备,调度资源。这两方面的开销太大了。通过云平台,我们可以降低 IT 资源成本,同时提高人员工作效率。

泰康上的三朵云

泰康对于整个云平台的设想是这样的,基于公有云和私有云的 IT 基础平台上构建三朵云:

目前这三朵云基本都落地了,在这三朵云之上,泰康业务的发展还需要依托于大数据和移动互联网。做云平台这一年半以来,我觉得云平台、大数据平台、移动互联网充分满足了泰康传统业务在拥抱互联网时的诉求:

IT 系统的发展历程

回顾整个泰康的基础架构,基本经历了三个阶段。

一是传统架构。小型机、X86 服务器或是集中式传播访问数据库,不管是 CS 架构的还是 DS 架构的,都是那种集中式访问传统架构。所有的硬件及功能都是割裂的,需要面对多个管理界面并分别维护 IP 和 SAN 网络。为了满足性能需求只能不断的通过纵向扩展的方式升级硬件设备,但存储与计算的分离设计限制了扩展性及灵活性。

二是虚拟化架构。我们在使用青云平台之前,就是采用 VMware 虚拟化架构,因为外部存储原因注定了这个平台不能快速进行业务、产品的发布,不能扩容。

三是基于云计算的融合架构。经过不断的努力,最终成功将 IT 系统架构从传统的三层架构演化为以超融合一体化设备为载体,以软件定义的云平台为基础,提供包括存储虚拟化、计算虚拟化、网络虚拟化以及提供统一管理调度平台的 IT 架构。

泰康云平台的收益

青云 QingCloud 作为泰康云平台主要技术解决方案提供商,是泰康云的重要组成部分,泰康云成熟的云平台技术构建了响应快速、动态灵活、可持续的云计算平台,有效地解决传统数据中心面临的资源管理复杂、运维操作风险高、服务响应慢的难题。泰康保险在实施云平台后的收益主要有以下几点:

资源池化带来的好处是解决了成本的问题,解决了快速提交的问题,还解决了统一性,一致性的问题。

通过泰康云平台,我们的基础设施可以实现高可用,同时解决了水平扩展的问题,另外,对于海量数据与信息,通过负载均衡技术也得到了解决。

自动调度技术是弹性扩展、弹性伸缩、负载均衡以及资源自动交付的必备技术。举个例子:现在我们的资源池上虚拟机器已经有 3000 多台了,随着 Docker 的引入,我们现在也运行了 2000 多个 Docker。如果没有一个好的自动调度技术,没有一个好的资源自主交付服务,最后我们的系统对于任何人来说,都会成为一个噩梦。

泰康的云平台具有极高的开放性,我们提供一定的 API 接口。这个 API 是由一个团队专门开发的,它是通过对 CMDB,还有自定义函数的定义,使泰康的云平台具有 API 服务,对外提供一些微服务,这样,开发团队在使用过程中会更方便,同时,也解决了第三方集成、个性化定制的问题。

自动化运维规范和体系的建设

泰康保险的自动化运维规范和体系建设图

上图是泰康保险的自动化体系建设,对于应用开发来说,需要遵从分布式架构的接口、数据开发规范,同时应用的部署和运行方式需要满足自动化运维框架的要求。对于运维工程师来说,需要建立针对分布式资源池的部署运维规范、建立创新业务架构运营和短时高容量交易的管理策略,建立伸缩性架构平台及工具仓库,以及建立配套的人员知识体系。

通过这种规范化的自动化运维开发体系模式的建立,除了拥有了全面的 IT 整合能力之外,还为泰康保险的业务、开发团队带来 IT 基础设施以及开发平台的稳定性、可靠性、敏捷与灵活性,对整个业务部门带来了极高的性价比。

『充电时间』上海、杭州让大家久等了,实践课堂马上与你见面,快来现场吧!本次课程内容仍以技术实践为主,以用户场景为切入,主要围绕 QingCloud 的技术理念、功能特性和使用技巧展开,话题将涵盖如何高效构建原生云应用,云端容器部署,微服务架构,应用感知,自动化运维等业内热点话题。

报名请扫描下方二维码或者直接点击链接报名

报名链接

2048 次点击
所在节点    推广
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/366196

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX