场景:

企业的日常 IT 运维中,对在云平台上创建的服务、应用、资源等的监控很有必要。BingoCloudOS 提供了监控服务(CloudWatch)可以随时监控、并在出现紧急情况时进行通知运维人员,但是人工可能无法全天候在机器前处理各种情况,如果出现瞬时负载过大的情况,有没有办法可以进行紧急的临时处理?

解决思路:

BingoCloudOS 提供了监控服务(CloudWatch),且可以和弹性伸缩服务配合,设置一套可以利用弹性服务的临时紧急处理办法:对指标进行监控,在达到相关负载指标警报线时可自动调用弹性伸缩服务进行临时处理,且通过简单通知服务告知运维人员。

具体步骤:

准备:关于建立“简单通知”,请参考博文 《当资源告罄前通知管理员,避免资源不足造成业务阻塞》

1、管理员登录云管控中心 BCC, 进入【高级服务→弹性伸缩服务→启动配置】中点击新建。填写配置名称,选择镜像模板(一般为部署好的业务系统的镜像模板)、实例规模类型、安全组、密钥,是否绑定弹性 IP,确认后点击保存。

2、进入【高级服务→弹性伸缩服务→弹性组】中点击新建,填写弹性组名称,选择启动配置、云网络、所在区域,设置需要的实例个数、最小实例个数、最大实例个数、默认冷却时间(不填则为默认时间 5 分钟),选择健康检查类型、关联的负载均衡(当健康检查类型选择 ELB 时必选),点击保存即可,弹性服务会根据弹性组设置来启动相应的弹性组实例。

3、弹性组创建成功之后,进入【高级服务→弹性伸缩服务→弹性组】,在列表中选中该弹性组,点击详情,在策略 Tab 页点击新建。填写策略名称、具体策略、冷却时间(不填则为弹性组中设置的默认冷却时间),选择日期限制和时间限制,点击保存即可。(可设置多条策略以应对不同情境要求)。

4、(以关联了负载均衡为例)进入【高级服务→负载均衡→负载均衡】中,点击关联的负载均衡详情,进入监控 tab 页,针对某监控指标设置警报,如请求数,点击请求数监控图表上警报图标。

5、在弹出的页面点击创建警报。 填写警报名称、警报触发的阈值条件、触发的操作,点击保存即可。

6、成功后,实际情况触发警报时,会自动触发的操作。

备注:本技巧的相关操作可参考如下视频。

相关功能:
  • BCC-高级服务-负载均衡
  • BCC-高级服务-弹性伸缩服务
最新版本:BingoCloudOS 7.0