1、云计算时代 IT 运维的发展趋势

目前,云计算已经从概念阶段演进为企业生产实施阶段,除了部署由相应的软件、硬件和虚拟化资源组成的庞大生产环境,还有一个问题摆在用户面前,那就是如何运维云平台?

在传统 IT 架构环境下,运维工作也是 IT 管理中的重中之重。而在云计算时代,由于多租户和分布式架构、容器与微服务等众多新技术的引入,开发/测试/运维一体化、大数据分析等应用需求的多样化,云平台所需要管理的软硬件基础资源和所承载的业务系统越来越多,运维工作也不再仅仅局限在安装部署与排障等环节,还考虑系统的高可用、可扩展、可变更和可计量等问题,系统复杂度已大幅上升。这时,运维人员要面对的是与以往不同的应用场景,需要保障的是 100 台或 1000 台、甚至上万台机器及其所承载业务系统的稳定运行,这就导致了运维难度与投入逐步增加,如果没有清晰的云运维规划和技术手段,云平台将难以高效的运转起来,所以云运维对于云平台建设者来说是至关重要的一环。

面对云计算时代传统的运维模式所遇到的巨大挑战,运维工作的转型升级已成必然趋势,急需为用户提供一种快速部署和应用运维的自动化系统,以大幅减少运维工作量、降低运维成本、加快运维响应时间,彻底改变传统的高成本、低效率的运维服务模式。

2、品高云自动化运维服务介绍

品高云基于在已有大型央企、金融、制造、政府、公安等行业对运维工作有着高要求的用户总结,借助品高云成熟的云资源编排技术,在品高云 V6.0 中提供了部署运维自动化,通过脚本模板的形式自动批量创建应用系统运行所需要的各类计算、存储、网络等资源,实现应用系统的快速部署上线,达到部署运维“自动化”的目的。

而在品高云 V7.0 发布的深度自动化运维功能,是在 V6 版本的部署运维自动化能力之上,针对业务系统的配置管理、弹性伸缩、规格变更等运维场景,为运维人员提供了图形化设计运维方案和设置常用指令,云平台根据运维方案和下发指令等,将操作经验固化为成熟的运维方案,服务的使用者可以以录入参数的形式将其输入到自己的业务系统之中,自动执行运维动作,进一步完善了运维管控,降低运维的成本和使用门槛。

3、品高云自动化运维服务功能特色

3.1 高效率的资源自动调度模式

利用品高云的自动化运维功能,开发人员可批量创建云资源。用户只需在模板中列举所需要的云资源,设置资源属性值,配置资源的关联关系,云平台即可自动完成应用环境的创建及配置工作,无需手工去创建各种云资源,大大提高了应用系统的整体运维效率。

3.2 运维方案的可视化界面设计

品高云提供了易用的可视化设计界面,用户通过“拖、拉、拽”的方式设计运维方案,并将运维动作与机器角色关联。设计完成后可保存在本地或云平台中,后期有类似需求时,可以直接使用该模板或者做适当修改即可,大大降低了使用门槛,减少重复工作。

3.3 兼容 AWS 标准

品高云云资源编排技术 API 接口兼容 AWS 的 CloudFormation 标准,让云平台运维过程标准化,帮助用户构建行业标准应用。

3.4 支持调用云平台多种类型资料

运维自动化支持调用多种品高云平台资源,包括:弹性计算实例、存储卷、对象存储、弹性 IP 地址、网络安全组、虚拟防火墙、弹性负载均衡、资源伸缩、监控告警、简单通知服务等等,满足用户构建灵活应用系统的要求。

4、技术架构

自动化运维技术架构图

运维方案设计: 服务设计者通过品高云自助服务平台,针对已有的服务制作运维方案,在部署方案设计器中将运维动作与机器角色关联,并且对该角色编写运维动作的前置及后置动作脚本,可保存设计好的运维方案。

运维方案调度: 服务使用者通过品高云自助服务平台,针对已有的服务创建出来的环境选择服务设计者设计好的运维方案,采集运维方案所需的变量及参数信息,开始执行运维动作,等待运维方案执行成功。

运维方案执行: 用户选择运维方案执行后,云平台后端对方案进行解析,抽象出该方案中的需要执行的运维动作,将运维动作分发到各自的处理单元,通过调用底层云,创建、销毁或者变更机器,并将机器与环境关联,并为新机器执行对应的前置后置动作。

运维方案执行完成后,云管控中心会采集运维方案所需的变量 (可选) 及参数信息,并完成方案执行后的审计工作。

5、功能实践——HaProxy 负载 Tomcat 架构日常运维

本次功能实践以 HaProxy 负载 Tomcat 架构增加网络节点为例,具体的操作步骤包括了创建或选择已建服务、运维方案设计、运维方案调用、运维方案执行。

5.1 创建或选择已建服务

首先,以普通用户的身份登录品高云自助服务平台,创建一个新服务或选择已建好的服务。本次功能实践我们选择已建好的 HaProxy 服务。

图 1 选择已建好的 HaProxy 服务

进入 HaProxy 服务详情页面,点击“操作按钮”否存在增加网络节点运维方案。从图 2 中我们可以看到 HaProxy 服务暂时还没有运维方案。

图 2 查看运维方案页面

5.2 运维方案设计

以平台管理员(运维人员角色)的身份登录品高云自助服务平台,进入【配置管理→高级服务→部署方案】,打开对应的部署方案,进入【版本管理】,点击“更多”,在出现点击的页面中选择“制作运维方案”。

图 3 选择制作运维方案页面

填写运维方案的相关信息,方案名称为增加网络节点,安装包无,方案说明即为 HaProxy 负载 Tomcat 架构增加网络节点。

若其他运维方案需要接入第三方软件安装包的话则需要上传,否则可以省略。

图 4 填写运维方案的具体信息

点击确定进入运维方案设计器页面,在设计器内编辑,主要通过“拖、拉、拽”的方式加入运维动作,设计器会自动识别出当前运维方案所属部署方案的机器结构,列出机器角色。

图 5 运维方案设计界面

设计完成后保存运维方案,此时部署方案内已增加了该运维方案。

图 6 运维方案已添加至部署方案内

一个部署方案可添加多个运维方案。除了制作增加网络节点外,还制作了调整 HaProxy 规格、删除网络节点。

图 7 多个运维方案已添加至部署方案内

此时,退出配置管理,再次转到 HaProxy 服务详情页面,并刷新页面,点击“操作按钮”可查看到已添加了刚刚设计的运维方案。

图 8 运维方案设计完成

5.3 运维方案调用

在 HaProxy 服务详情页面,点击“操作按钮”,选择增加网络节点运维方案,并录入增加节点的数量信息,并可以看到云管控中心对资源变更所产生的计量信息。点击确定即可等待平台自动调度完成相关操作。

图 9 运维方案调度使用页面

5.4 运维方案执行

选择使用增加网络节点运维方案后,用户可通过任务工单查看运维方案的执行进度。

图 10 运维方案执行进度页面

运维方案执行完成后,可通过服务详情查看方案是否执行成功。通过图 11 我们可以看到已增加了一个 IP 为 10.202.149.172 的网络节点,即说明方案成功执行。

 

下面是自动化运维服务的 demo 视频

目前,自动化运维服务已经在品高云 7.0 版本中正式发布,不仅仅针对安装部署的自动化运维,还包括了系统上线后的后续运行的自动化运维。对于品高云 7.0 中更多亮点功能介绍,还可以访问官网的如下地址了解。

视频连接:http://cloudos.bingocloud.cn/templates/newlook.html