编者的话:邱洋,品高云(BingoCloud)的产品总监,国内首个商用云操作系统 BingoCloudOS 云操作系统由他的团队创建,从 2008 年开始,他见证了品高云从零到现在的过程。现在是品高云的第七个年头,他笔下的“品高云七年”是怎样的?

01 公司简介(成立 13 年、CMMI5、云大规模商用)

广州市品高软件股份有限公司,成立至今已经 13 年了(成立于 2003 年),目前全国员工总数超过 600 人,其中 90%以上是技术人员。公司的核心业务是云计算产品研发,大型行业客户的应用系统建设与企业 IT 顾问服务。客户中拥有众多世界 500 强企业,包括:腾讯、中车、招商局、中国移动、南方航空、中国石油、一汽大众等。品高公司通过了软件能力成熟度最高的 CMMI5 级认证和企业信息安全管理 ISO27001 认证。

截止 2016 年 9 月,品高公司的云计算产品 BingoCloud(以下简称品高云)已经被全国 15 个 省/直辖市的 超过 150 家 大中型企业在生产环境使用,包括行业龙头:腾讯、中车、国药、招商局、招商银行等客户使用品高云作为其业务的主要支撑云平台。目前已经累计在客户的数据中心部署 超过 2 万台 物理服务器。最长的客户的累计使用时间已经超过 43000 小时(5 年)

品高云客户版图

品高云(BingoCloud)的定位是一个企业级的、具备 IaaS+能力的云操作系统,它的目标是成为企业云计算战略的引擎,而这个产品的研发竟源于一个偶然的项目需求。

02 云源于大型企业的刚需

在 2008 年前后,品高正负责国内某航空公司的电子客票系统建设,这个项目属于民航系统的第一个电子客票系统。此项目成功上线后,为了进一步扩大电子票的销售范围,预计拓展海外业务,这时面临一个棘手的问题,就是国外航空法要求,电子票的销售数据必须在本国,而这就涉及到要将系统部署到国外,而第一步是在国外建设或租用数据中心。而这则需要很长的谈判和考察周期,一定程度上响了海外电子票的布局计划。

而在此时大洋彼岸的互联网公司 Amazon 正式在它的 AWS 云平台中推出了云主机服务(EC2),并且配套提供了云硬盘(EBS)和弹性 IP(EIP)等基础设施服务。用户只需要压一张信用卡给 Amazon,然后就跟电子买书一样,在 web 上点击两下就可以在几分钟内快速获取到大量立即可用的基础设施资源,这种模式在当时看来太超前了,以至于客户虽然“十分想要”,但碍于安全和审计的需求不得不另选它法。

但品高云认识到, 这种“与平台”而不是“与人”要资源和服务的模式,将为企业 IT 带来无限便捷性与生产力,并最终将企业的工业化推向更高的水平, 而就是在这一年品高公司决定自己研发一套面向企业的云平台——品高云。

03 吃自己的狗食 dog food(2010,V1.0)

经过近 2 年的研发和测试,品高云的第一个商用版本 V1.0 在 2010 年 2 月 2 日拿到著作权,是国内首个(中国版权保护中心可查到)拥有完整自主知识产权的基础架构云产品。

在研发期间品高云的定位就是企业级,而企业级的重要考量点就是稳定、可靠。因此,除了在底层采用多活的三层控制架构外,开发语言也选择了更适合高并发控制的 ERLang(巧合的是同期一个开源的云软件 eucalyptus 也是这种架构,但开发语言是 Java 和 C)。

品高云的调度控制架构

另一方面,为了验证产品的质量、稳定性符合预期,品高公司把自己作为第一个云客户,边实践边研发。因为在 2008、2009 年品高公司的行业软件研发业务迎来了爆炸式增长,诸如:中国移动的 ERP 类项目、一汽大众的国产化类项目、中石油的 OA 类项目、中国再保险公司的邮件系统项目等等,每年有近 200 多个软件项目在并行开发。密集的软件项目需要大量的开发测试服务器,而这对品高公司自己的 IT 资源管理水平和交付效率提出了更高要求。

在品高云 1.0 中,功能研发重点在控制器的高可用(物理机宕机不影响业务运转)、高效的服务器调度(用轮询、贪婪、集中化、利旧等模式使用服务器)、实现基础云服务(包括云主机 EC2、云硬盘 EBS 和弹性 IP 等)、实现云主机的配套高级服务(包括:负载均衡 ELB,应用自动化部署服务)。

04 生产业务的支撑(2011,V2.0)

2011 年云计算在中国还是只闻其声不见其人的阶段,越来越多的人希望了解云计算到底是怎么落地的,品高公司携最新推出的 品高云 V2.0 首次亮相中国云计算大会,是当时唯一一个允许人们现场体验的云产品, 这在现场引起了轰动,展位可以用“人山人海”来形容。并且得到了包括中国工程院院士倪光南的高度肯定,指出 “国内这么多云计算公司,你们是真正在 IaaS 上做出成绩的”。

2011 年中国云计算大会品高云展台

也正是借着中国云计算大会的平台,品高云被更多企业客户所了解,包括广州政府、海南航空、澳洲电信等一批企业客户开始尝试使用品高云,而品高在这一年也把公司的邮件、SVN、OA、门户、财务等生产系统迁移入云中,尝试在 7*24 的业务压力下考验云的能力。同时,通过这一过程切实掌握了应用向云迁移的方法论和规范,为日后协助客户的应用云化奠定了良好基础。品高云也在这一年被 Intel 推选为全球推荐架构。

在品高云 2.0 中为了应对运维人员对业务实时监控的需要,加入了云监控系统 CloudWatch(针对云资源的运行、变化的实时监控系统,并支持触发联动报警)、弹性伸 缩 AS(当虚 拟机集群负载能力不足时,自动增加虚拟机数量), 也是业内第一个支持弹性能力的私有云产品。

05 公有云(2012,V3.0)

虽然品高云当初的定位是企业云操作系统,但是在当初设计路线图的时候,为了更好的借助产业链的力量,除了架构和代码是自己编写外,云平台各项服务的 API 选择了兼容 AWS 的相应标准。这使得品高云天生具备公有云的运营基因,也正是因为这个原因,品高云在 2012 年跟世纪互联与中国电信合作,共同运营的位于西部电信的天翼云,这也是中国电信首个对外公开运营的 IaaS 公有云项目,虽然后来由于世纪互联战略转型退出了,但是此后 3 年多的无故障运营,充分的验证了品高云在支撑大规模公有云方面的能力。

基于品高云的中国电信西部信息中心天翼云

在品高云 3.0 中,主要推出了应对公有云运营的 BOSS 平台(针对服务的计费、定价以及 CRM、ITIL 等组件),业内首个私有云 RDS 功能(代替 DBA 在云中自动部署、备份、运维关系数据库系统),除此之外,为了应对在公有云运营过程中的 vm 数量逐渐增多所突显的集中式存储的带宽短板, 品高云推出了分布式存储系统 BingoFS,并且通过本地 I/O 优先的策略提升 vm 的 I/O 效率。 此举极大的降低了运营成本,增加了产品收益。

06 大数据与科研(2013,V4.0)

2013 年一个新热词诞生—大数据,一时间各行各业都希望借助大数据来做点什么,而拥有大数据的往往是科研机构和高校,而对他们来说进行大数据分析,还要掌握和运维另一个叫做 Hadoop 的开源产品以及一套新的集群,为了降低客户的上手成本和实现对现有资源的最大化利用,品高云 4.0 中,主要推出了大数据服务 EMR(在客户现有集群中自动部署、扩容和回收 hadoop 集群的云服务),支持了容器技术(为了避免 vm 机制带来的性能损耗,用 LXC 来运行 hadoop 环境),推出了 NFV 功能(云中的防火墙、云中的路由器)。

英特尔的全球云计算参考架构列表

这一年,品高公司收获了业内最大私有云案例——腾讯公司的企业 IT 云。 也是和腾讯一起,品高云成功验证了单集群 500 台物理机的规模(是 VMware 的 15 倍),后来又成功将这数字提升至 1024(是 VMware 的 32 倍),将私有云的健壮性和扩展性推进到一个新高度。

另一方面,品高云的客户部署规模突破了 3000 台物理机,包括广州地铁、北京渲染平台、惠州政务云、中山政务云、中山大学、广州大学等一批典型的行业客户开始使用云平台,这时品高开始考虑云计算该如何针对行业客户的特殊性,提供更加“专业”的服务能力,也是在这一年品高云推出了:HPC 集群服务 (获得了 ICR 认证)、3D 渲染服务,并成功的应用在天河一号先导项目,科大讯飞,中山大学、广州大学等科研与教育客户中。

07 集团云(2014,V5.0)

2014 年,业内开始畅谈混合云,而对这一需求最为迫切的往往是大型集团企业,它们拥有自己的固有资产,同时又希望拓展基于互联网的业务。于是在品高云 5.0 中推出了混合云管理能力(同时管理多个私有云和基于品高云的公有云)、计算存储一体化架构(将虚拟机和分布式存储部署在一台物理机中,现在普遍理解为超融合架构)、全新的自助服务平台(通过服务目录、服务计量、流程等将集群企业 IT 能力显性化),并成功在国药集团、招商银行、广州地铁等客户中得到应用。

某银行客户的云服务目录

这一年,品高云客户装机量突破 5000 台物理机, 同时为了满足企业对 IT 云化另外两个方面—移动信息化和大数据管理的综合性战略需求, 品高云正式推出了企业级 PaaS 平台 BingoLink(企业移动信息化平台 MEAP)和 BingoInsight(企业一站式大数据平台),原来的 IaaS+产品命名为 BingoCloudOS(企业云操作系统)。

BingoLink: 可以帮助企业完成传统业务向移动化的迁移,与单纯的 MEAP 平台不同,除了提供应用开发、整合接入、应用管理、安全保障等能力外,还自带开箱即用的社交组件(如通讯录、网盘、自定义流程等)。

BingoInsight: 更是在原有 IaaS+所提供的大数据处理能力(提供 hadoop、hbase、Spark、R 语言等集群交付)的基础上,增添加了大数据开放能力(提供数据目录、数据权限、数据接口的统一管理)和可视化大数据分析平台(提供仪表盘、报表、数据地图、自助分析等多种分析工具,帮助客户快速交付数据价值),实现企业大数据的一站式管理。

品高云产品覆盖企业 IT 云化的多方面

08 企业云演进策略(2015,V6.0)

这一年品高云已经在 12 个行业、超过 100 家大中型客户中落地,并且作为它们的全业务支撑平台。我们开始进一步思考【企业级的 IaaS+云操作系统】应该具备哪些特质?尤其通过对腾讯、招行、国药、中车等一系列行业标杆客户的成长访谈和对 IT 业内趋势的分析的判断,总结了三个重点诉求并推出了品高云 6.0:

【资源更匹配业务】: 意味着客户云资源池中的基础设施,能够自动感知用户要部署业务的需要,如高性能、高 I/O、特殊硬件等,并自动交付相应能力。为此品高云在原有 8 种资源全局调度策略外,新增了调度标签功能(通过为硬件打业务标签,用户部署应用时云可以交付提供相匹配的硬件资源)、支持 HPC 场景的硬件(包括:GPU、PHI、IB 网络等)、支持了为不同场景设计的更多存储系统(包括 ceph、lustre)。

并且为了支持超大规模云集群的公有云、行业云场景,品高推出了企业级 SDN 模块:包括拥有核心专利和高可用的 SDN 控制器、兼容 openflow 和企业原有 vlan 架构、网络功能 (NFV) 可以动态扩展(自带虚拟交换机、虚拟防火墙、虚拟路由器、虚拟子网、虚拟网关等 10 余项全新 NFV 功能)。与世面常见 SDN 架构不同的时,品高 SDN 不需要用户采购专门硬件即可实现。而且在这一架构下,品高云的单集群服务器规模未来有望突破 5k 台。

【更个性的云服务】: 由于客户的特质(规模、行业、IT 发展阶段)的不同,可能意味着云平台的原生服务不能够完全满足客户的需要,因此私有云不应该跟公有云一样,采用僵化的功能形式,让用户去适应产品。而是更积极的采用灵活的架构,能够为用户的特质量身定做更加个性化的云服务功能。为此品高推出了云服务创造功能(通过资源编排+应用自动化部署方式交付各类企业所需的个性化云服务)并在业内的私有云中第一次实现不用编程的方式上架新服务的模式,以及推出了可自定义指标的云监控增强版(允许用户针对主机、网络、应用等对象通过 shell 方式编写查询脚本,云平台自动生成汇总的监控信息,支持报警和触发弹性)。

【可演进的云顾问】: 云计算的战略如同企业的 IT 战略一样,不是买一个软件,做一个项目就可以达到的,因此每个企业都需要一个经过验证的可演进的路线图(roadmap)。品高凭借大规模的商用案例和行业标杆的实施经验,将云计算的实施划分为:云基础建设(数据中心集约化)、云服务能力构建(管理重点从资源到应用)、云运维体系完善(原有 IT 流程& 服务转型升级)、混合云与服务能力输出(IT 成为利润中心)这 4 个阶段,帮助客户逐步实施。甚至与标杆客户一起联合推出了《企业云计算演进策略与实践报告》,共更多的企业 CIO 参考。

企业云计算演进关键阶段

另一方面,由于品高云提前布局企业移动信息化市场,通过 BingoLink(一个社交化的 MEAP 平台)和各种底层的 IaaS+云能力的组合方案,在对此有迫切需求的公安行业取得了突破进展,分别支撑了深圳、广东地区移动警务平台。在粤警民通项目上线的前三个月的时间内,就接入了 123 项 业务 ,其中省级业务 46 项,地市业务 77 项,接入地市包括广州、深圳、珠海、佛山、惠州、梅州、顺德、东莞、中山等。全面为当地市民提供业务的查询、预约、预办理、互动能力。根据平台后台数据显示, 平台实际用户数已达 215 万,平台在线用户达 6 万以上。至此充分证明了品高云在支持规模并发访问和移动互联网业务方面的能力。

09 总结

2016 年是品高云正式发布的第 7 个年头(很快 7.0 就要到来),品高云平台也从最早的开发测试到生产系统支撑、从企业传统应用到互联网业务支撑、从小规模私有云到大规模的公有云、从提供通用类功能到行业特性功能、客户从自己到行业标杆、部署的物理机从第 1 台到超过 20000 台。

一路走来我们越来越发现,对于客户来说, 没有最好的云产品,只有最合适自己的产品。 抛开客户的实际需求谈云产品的功能和特性只能为用户徒增烦恼,因此当企业的 CIO 在选择一个云计算合作伙伴(而绝非单纯选择技术)时,建议从如下几个维度多考虑下,以便更快实现企业心目中的云计算战略。

  • 标准化程度:技术是否被客户和其他厂商同时支持?厂商自身的标准化成熟程度如何?
  • 包容性:为了避免锁定,产品是否兼容更多的基础技术供用户选择,而不要盲目相信所谓最佳实践?
  • 客户的认可度:应该考量产品在更多场景化下的验证,观察用户尤以及行业标杆用户的认可度,而不是站在厂商所谓的趋势角度。
  • 可维护性:不要单纯看中一次性投资,更要观察隐性成本。
  • 中立性:看到厂商真正赚钱的部分,而不是它鼓吹的部分。
  • 代码控能力:看中厂商对代码和产品核心发展方向的控制度,而不是代码本身

推荐 CIO 选择云计算合作伙伴的考量点


-第二部完-