云计算环境的 3 大要素分别是计算、存储和网络,计算和存储相对较为成熟,有大量的商业方案和开源方案,用户可选的也比较多。相比计算和存储,网络容易被用户忽视,却会直接影响企业用户使用云计算的感受。

相比传统物理网络环境,虚拟网络架构下的交换机、路由器设备都由软件实现,SDN(软件定义网络)实现了传统网络设备的绝大多数功能,在传统网络环境中常见的路由器、网关和防火墙大都被 SDN 所取代,传统网络设备只留下了连接服务器的交换机。

神奇的 SDN 技术,充分借助了 x86 服务器在虚拟化和高性能方面的技术优势。各家云计算方案中的虚拟网络环境千差万别,实现方式也各不相同,但有一点是一致的——虚拟网络需要依靠服务器计算能力。在云计算规模越来越大的今天,能充分发挥计算实力的云计算服务商,往往都有一套出色的虚拟网络架构,比如在 SDN 架构中颇有心得的品高云 SDN 系统。

万兆虚拟网络环境

  • 据 IDC 2016 年全球以太网市场调查报告显示:“10Gb 以太网交换机一季度的收入 20 亿美元,同比增长 1.2%; 但是 10Gb 以太网交换机端口的出货量却增加了 830 万个,同比增长 29.8%……数据显示 10Gb 以太网依然占据着企业级市场的主导地位”。

用户端大都选择了 10Gb 以太网,那么相应的在评估私有云网络时,标准自然也要跨进万兆的大门。在 SDI(软件定义基础架构)潮流的驱动下,大量的虚拟服务器主机、SDS 存储环境等都是网络带宽的消耗大户,因此评估私有云网络环境时,10Gb 虚拟网络已经是一个必要条件。

企事录在品高云 SDN 环境下,围绕万兆虚拟网络展开多项测试和分析工作,为用户介绍选型/部署私有云环境时,虚拟万兆网络环境对企业级业务的意义。

高带宽能满足多核服务器的计算性能优势群

在数据中心里,两路服务器是企业主流的选择,典型的两路 Xeon E5-2650 v4 服务器可以提供 24 核 48 线程的计算能力,这些服务器大都使用了双端口 10Gb 网卡来满足虚拟化/云计算的网络架构需求。一台物理服务器在私有云环境中,往往会承载了数十个虚拟服务器主机,如果停留在 1Gb 网络带宽下,几十个虚拟主机一起争夺网络带宽的画面不可想象。

因此用户要想让自身的企业级应用在云计算环境下具有较为出色的性能表现,除了较高配置的计算性能(计算核心和内存容量)外,云主机提供万兆虚拟网络是一个必要的条件。

高带宽带来的高 I/O 对存储性能有明显的提升

云计算环境中,存储是一个非常重要的项目。在私有云中最常见的是使用 SDS(软件定义存储)架构,通过多台存储服务器构成的存储池来对外提供存储服务。在典型的云计算环境中,用户需要 10W+IOPS 的存储性能才能满足多租户的存储需求。要满足这样的指标,除了在 SDS 架构中使用 SSD 来加速存储性能外,10Gb 的双路网络环境也是必要的配置。

虚拟网络的高带宽会对管理提出严苛的要求

就像在物理网络环境中使用防火墙一样,如果用户都是万兆的网络链路,但对防火墙的需求不仅仅是千兆的十倍,复杂的网络矛盾在高速网络下回被成倍放大,以至于拖累整套网络环境。

在 SDN 的虚拟世界环境中也是如此,如果虚拟网络是 10Gb 链路,那么 SDN 控制器就需要消耗更多的计算/内存资源来完成相应的网络业务,当数据以 10Gb 的流量向 SDN 奔涌而来的时候,对 SDN 控制器就是一个巨大的考验,如果 SDN 控制器不够强壮,轻则系统卡顿,重则虚拟网络架构崩溃。

品高云 SDN 典型技术

在云计算环境中,针对网络环境有大量不同于物理网络环境的设置,在这里以品高云为例,介绍几个在云计算环境中经常会被用到的技术。

隐藏网关

在大规模云网络下多租户使用海量的自定义 VPC,虚拟化网关容易成为网络的单点或者资源消耗。Bingo 通过 SDN 以流表的方式实现分布式虚拟化隐藏式网关,这样的网关无单点,零消耗,并且可以抵御虚拟机恶意攻击。

虚拟网络环境内的广播抑制

品高云 SDN 系统在单 VPC 下可以支持 5000 台物理主机,支持的 VM 数量无上限,如此大规模的网络环境下,虚拟机之间的访问,可能会造成广播风暴,增加承载网络的压力,造成访问响应慢等问题。

注:SDN 控制 IP 间的访问抑制了基础网络中的广播风暴。

无叠加转发

VXLAN 是在云计算环境中经常用到的网络技术,但是叠加的数据包头多了 50 个字节,在超大规模部署下会影响带宽,品高云 SDN 采用了无叠加转发设计,对比物理网络只有 1.2% 损耗。

实战万兆虚拟网络

“网络性能好不好,打个流量就知道”。在物理网络时代,考察网络架构和性能基本是这样的套路,在虚拟网络时代,要考察网络环境的优劣,还是这样的方法。所不同的是在虚拟网络环境中,网络流量有两种可能:

一类是在同一台物理机内的虚拟服务器间的网络流量,这些数据包不通过服务器的物理网卡,直接在虚拟网络环境内完成,这样的网络带宽测试完全依赖于虚拟网络环境;

另一类是在两台物理服务器间,数据流量要经过物理网卡和物理交换机,更能体验整套私有云环境的网络性能。

经过前期对企业云业务的分析,最后终将品高云 SDN 性能测试第一阶段的平台选定在一套多台服务器的云计算环境中,大部分业务流量是跨物理服务器的,这样才能确保用户关键业务的可靠性。

测试环境是一套多租户的私有云环境,基于多台物理服务器,服务器间为双 10Gb(双口 10Gb 网卡)网络环境,多个虚拟主机分散在不同的物理节点上。

跨 NC 万兆流量测试

得益于品高云 SDN 的控制,在同一个 VPC 下,基础网络内没有其他异常的网络流量,在 VPC 内各个虚拟主机没有网络负载时,分布在两台物理主机的 VM 主机,使用 Netperf 进行点对点的流量打压测试。

红色箭头代表网络流量走向,测试包尺寸涵盖了 64 字节~1518 字节,测试成绩整理后汇总于下表:

上图是品高云虚拟网络带宽性能测试结果曲线。灰色曲线是无其他压力流量下的成绩,橙色曲线是跨 NC 有强流量压力时的性能曲线。从表中可以看出,虚拟网络性能在包尺寸 1024 时达到了 8.447 Gbits/sec 的带宽,接近了 10Gb 网卡的物理性能。即便同环境下有强压力流量的存在,品高云的虚拟网络依然能达到空载 95% 的性能,显示出品高 SDN 优秀的网络控制能力。

对标物理网络环境测试

我们在企事录的实验室用物理服务器环境下的 10Gb 物理网络环境进行了点对点的性能测试,得到如下结果:

从上表可以看到,物理网络在 256 包下就能获得 8.805 Gbits/sec 的带宽, 而虚拟网络则要在 1024 包下才能获得 8.4Gbits/sec 的带宽。随后两者性能曲线几乎重合。在企业级用户的实际使用环境中,最小的数据包也要 4K 尺寸,因此企事录认为: 在实际使用中,品高云虚拟网络带宽与 10Gb 物理网卡带宽相同,无明显性能差异。

总结

品高云在自研 SDN 架构的支持下,在虚拟主机中提供真实的万兆(媲美 10Gb 物理网卡)虚拟网络环境,可以满足私有云用户复杂的企业级业务的网络需求。即便在其他业务占据了同链路的网络带宽,品高云 SDN 环境也能给用户提供 90% 的可用网络带宽,使得用户在复杂的高带宽网络中获得高可靠和高可用的云计算环境。