云时代:重新定义运维

2017-06-13 15:03:24 +08:00
 timocoffee

[云计算时代]

云计算作为改变世界的力量,逐渐开始展现在各种应用中,这场技术变革的演进超出了许多人的想象。早些年,当我读到《 IT 不再重要》这类文章时,对云计算所具备的水电般“按需使用,按量计费”的优易性,既为之兴奋,又苦恼找不到具体的实践支撑。

近年来云计算发展迅猛,以笔者这几年切实帮助传统企业上云和参与卓易云创 DroiBaaS 产品运维的过程,恰好是云计算从“天”到“地”变革演进的一个缩影。在这个过程中,笔者对运维重新理解、不断摸索以及在实践中重构认识。

云计算作为一种公共资源,大规模、低成本、高效率、可服务,是互联网时代的水、电。但云时代的运维,到底该做怎么样的转变?笔者认为是“重”与“轻”的转换。

[传统运维之“重”]

传统运维模式,虽然各产品的业务和规模上略有差异,但结构上都很类似,从最底层的数据中心、网络、服务器等基础运维,到数据库管理、安全管理、系统维护和业务运维,需要各环节紧密合作。尤其是对中小企业,也要五脏俱全,加之运维所具有的专业性、规模化和周期性等特点,使得运维投入所产生的价值往往不尽人意。传统运维模式,让企业主不堪重负。

[云服务使用者之“轻”]

云时代让云服务使用者变得很简单,企业可以集中优势专注于产品设计和运营,强化产品。而产品的绝大部分运维工作交给云计算运营商来实现,降低企业对运维的依赖,运营效率提升了,高可用提升了,成本控制弹性了。

[云计算平台运营商之“重”]

拨开云层,我们将发现云背后所承载的运维实现构成了云计算平台运营商的运维之“重”。

这个“重”包含 2 个层面的含义:“量”和“重”。随着业务的发展,DroiBaaS 上的用户规模不断上升导致请求量的不断增加,因此投入的设备量、带宽量也随之增多,伴随着安全风险的增加以及服务可用性目标的提升。

运维在保障平台服务质量中扮演者核心角色,从运维人员组织、过程改进、系统优化到运维自动化、智能化等,各个环境都必须紧密围绕云计算平台特性进行协同。如何实现云计算运维的最佳实践,所涉及的技术难度、操作强度在“量”上非常之“重”。

二是“责任”之“重”,DroiBaaS 平台整体服务品质,直接关乎到其上承载上万开发者产品的可用性、口碑和生命力。保障好云生态系统的健康发展,让运维人员深感责任“重”大,丝毫不敢掉以轻心。

[云计算改变运维]

云计算平台的复杂性和高灵活性,对运维来说是个全新的挑战,关键是运维思路和体验必须转变。这种转变必须基于云计算特征进行重构,并持续改进。而当今没有最佳实践可循,需要运维在摸着石头过河中不断积累经验并总结提高。

总结起来,云计算平台运维具有以下一些特性:

群集是基本运维单元——

云平台的节点由普通服务和网络设备构成。平台的高可用性,不再依靠传统的大量投入冗余硬件,而是通过云计算平台自身的健壮性来保障。

大规模——

云计算群集需要达到一定规模,才能实现平台的高可用、低成本。由此在进行运维规划和实现时,都要考虑到大规模。

易维护——

在大规模下,快速实现群集部署、迁移、扩容、缩容、故障处理等。要达到这个目标,需要从 IDC 选址、网络设计、服务器选型、系统安装到云平台实现的全局统筹的规范化,基础设施即代码,一切纳入配置管理,通过开源工具与自研发实现运维的自动化、智能化。

云时代运维职位要求——

运维人员要有深厚的理论知识基础,包括硬件、网络、系统、安全,灵活的应变能力,快速的学习能力,强壮的体魄。当然,还要有一些基本的素质要求:

业务思维 业务是企业发展的根本,对业务有充分的了解,从业务角度关注运维。

系统思维 通过有效整合各种资源来辅助运维工作,甚至具备独立开发运维工具能力。

运营化、过程化管理 运营化、过程化管理来做运维,持续改进,将运维工作逐步标准化、自动化、智能化。

1303 次点击
所在节点    云计算
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/368094

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX