[关闭]
@gaoxiaoyunwei2017 2018-01-19T14:47:34.000000Z 字数 1455 阅读 530

云场景下自动化运维演变

白凡


页头
讲师 | 于春晓
编辑 | 白凡

1. 自动化运维演变背景

今天主要跟大家分享一下就是云场景下的自动化运维演变。现在的数据中心,基本上都做了建设了云平台,在不同的、多源的资源,怎么进行统一的运维管理。

image.png-120.3kB

可能有各种包括我们安装软件应用,这些都离不开自动化。从基础设施到应用,端到端的自动化。这是在云场景下从IT设施到端到端的自动化的一个场景。

image.png-116.7kB

1.1 CMDB自动化整合

在云场景下,传统CMDB的维护工作量要远远超出传统的运维所能承受的,比如在云下面可能有各种的业务,怎么去进行运维维护是个问题。这个当然也跟用户的分类有相应的关系,但是在云场景下,它是整个IT架构的掌控者,是实现很多的自动化的基础,而云场景下CMDB,需要怎么整合自动化,这个问题值得思考。

image.png-304.3kB

1.2 ITIL流程弱化

目前运维体系中,ITIL流程越来越弱化,在传统的运维中常常会用到ITSM的工具,我们Devops在运维以后,包括一些发布,包括一些资源申请,业务的发布,其实也已经实现了流程的自动化,这也是值得思考的问题。

image.png-63.7kB

1.3 自动化工作的实现

在云场景下,这些自动化的工作都需要云管平台来实现,当然很多的用户感觉云管理平台这块规模比较宏大的,包括基础设施进行管理,包括PaaS/IaaS等等。

image.png-82.2kB

2. 全新云平台统一管理编排资源

积雨云管理平台可以帮助实现IT设施的统一管理,云这一块的管理平台,包括一些基础的小机云,包括X86的,包括存储的,包括网络的还有PaaS云,公有云都进行统一的纳入,包括服务目录,对外可以提供一个产品服务的能力、资源编排,进行一个相应的集成。

image.png-120.1kB

2.1 云平台的统一服务

就是云管理平台实现IT设施的统一服务,主要是使用者可以申请相应的资源,包括通过流程平台,当然这个流程平台可以进行相应的流程审批,通过审批以后再进行一个请求通过,还有手动干预,然后资源交付,这个是在云平台上经常有的流程。

image.png-86.5kB

2.2 云平台的多租户服务

接下来是基于云管理平台实现IT设施的多租户服务,就是说系统做出一个模型,基本上我们都会用两种租户加设计的,用户分相应的权限,不同角色看不同的资源。

image.png-189.7kB

2.3 云平台的自动化运维

自动化运维,这是我们提供的自动安装的场景和典型实现:

我们这边的收益主要是快速发布,对用户需求快速实现软件的价值,包括缩短迭代的周期,之前一个月的,可能现在可以一周了,这样推进了交付过程的标准化,使整个交付过程的进度缩短,其中亮点包含了通过Ansible来实现。

image.png-171.8kB


2.4 日常维护场景和实现

日常维护是运维最常见的场景,包括可能有网络设备服务器,数据库、中间件这些存储和应用,包括我们很多像启停、备份、变更、检查清理等。巡检也是通过计划任务的定时,循环、延迟执行,任务的生命周期管理,巡检报告输出,可以降低人工成本和人为的风险。

image.png-170.9kB

2.5 故障响应的场景及实现

目前在云平台上运维工作总是在充当救火员的角色,出现问题我们对故障进行相应定位,基本上出现故障后,定位可以跟相应的知识库的关联,然后自动分析相关的一个分析,再进行一个判断,有些故障可以进行自动的处理,有些需要人工干预的来触发相应的流程。

image.png-164.1kB

2.6 报表和容量的规划场景

主要包括资源类、运维类、容量类的报表,领导层可能关注报表。而运维实施,也通过容量进行一些容量的规划的整体建议,可以写对内对外的应用报表的需求。

image.png-200.5kB

云化场景下自动化运维实施效果总结,需要说明的就是像网络、硬件等其他的基本上都可以实现半自动化和全自动化的操作。

image.png-128.1kB

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注